Gene Jann_2963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2963
Symbol
ID	3935433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	2983118
End bp	2984164
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	64%
IMG OID	637905333
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_510905
Protein GI	89055454
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.265581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.013734
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGAAA AACTGGCCCT GCCCCTTCTA CGTCGCCTTG ATCCGGAGCG CGCCCATGGG 
CTTGCGCTGA AGGGGGTGAA GGCAGGGTTC GGGCCGCTGG AAGGACCCTA CACCTCCCCC 
CGTCTGGCCA CGCGGATCGC CGGGATGGAC CTGCCCAATC CCATCGGGCT GGCGGCAGGA 
TTTGACAAGA ACGCAGAGAT TGCAGGCCCC TTGCAACGGG TGGGCTTCGG GTTTCTGGAG 
GTCGGTGCCG CCACCCCAAA GCCGCAGCCC GGCAACCCCA AACCGCGCCT GTTTCGCCTG 
ACCGAGGACC AAGCCGCGAT CAATCGCTTT GGCTTCAACA ATGACGGAAT GGACGCCATC 
GCCGCGCGCC TGAATGGCCT GCCGCGCGAG GTTCCGATCG GCCTCAACCT GGGCGCCAAC 
AAGGACAGCG CAGACCGCGT CGCCGACTTC GCTCGGGTCT TCCAGACCTG CGCGCCGCAT 
ATCGACTTCG CCACAATCAA CGTCTCCTCC CCCAACACCG AGAAATTGCG CGATCTGCAA 
GGCAAAGCGG CACTTCGCCA GATTATCGCG CAGGTGGATG CCGCCCGCAC CGATGCGCGA 
GTGGCGTTGT TTCTGAAGAT CGCGCCCGAC CTGACGATGG ACGAGCTGGC CGATATCGCC 
GAGGTCGCTT TGGACAGCCC GCTTCAGGGC CTCATCGCCA CCAACACAAC GCTGGATCGC 
ACCGGCCTCA AAAGCCGCCA TGGGCAGGAA AAGGGCGGCC TCTCCGGCCA GCCAGTGTTT 
GAAAAATCGA CCCGCACGCT GGCCCGTCTC TACCAACTGA CCGAGGGCAA ACTGCCGCTC 
ATCGGCGTCG GCGGCGTCGC CTCGGCCGAG CAGGCCTATA CCAAGATCCG CGCGGGCGCG 
ACCGCTGTTC AACTCTATAC CGGGCTTGTC TATGGCGGGT TATCGATGGT GACCAAGATG 
GTCAAAGGGG TTGATGCGCG CCTCCAGCGT GACGGCTTCG CCAGCGTGTC CGACGCCACG 
GGCACAGGAG TGTCCGAATG GACATGA

Protein sequence

MLEKLALPLL RRLDPERAHG LALKGVKAGF GPLEGPYTSP RLATRIAGMD LPNPIGLAAG 
FDKNAEIAGP LQRVGFGFLE VGAATPKPQP GNPKPRLFRL TEDQAAINRF GFNNDGMDAI 
AARLNGLPRE VPIGLNLGAN KDSADRVADF ARVFQTCAPH IDFATINVSS PNTEKLRDLQ 
GKAALRQIIA QVDAARTDAR VALFLKIAPD LTMDELADIA EVALDSPLQG LIATNTTLDR 
TGLKSRHGQE KGGLSGQPVF EKSTRTLARL YQLTEGKLPL IGVGGVASAE QAYTKIRAGA 
TAVQLYTGLV YGGLSMVTKM VKGVDARLQR DGFASVSDAT GTGVSEWT