Gene Gobs_4555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_4555
Symbol
ID	8756253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	4780347
End bp	4781678
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	70%
IMG OID
Product	NADH dehydrogenase I, D subunit
Protein accession	YP_003411476
Protein GI	284992922
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCA CCTACAACCC GGCCGACCCC TACGCCGGCT CCCGGGAGAC CACCGAGGGC 
CGCGTCTACA CCGTCACCGG CGGCGACTGG GACCAGACGC TGGGCACCGA GGCGTACGGC 
GAGGAGCGGC TCGTCGTCAA CATGGGGCCG CAGCACCCCT CCACCCACGG CGTGCTGCGG 
CTGGTGCTCG ACCTCGAGGG CGAGACGGTC ACCAAGGCCC GCGTGGTGAT CGGCTACCTG 
CACACCGGGA TCGAGAAGAA CACCGAGTAC CGCAACTGGA CGCAGGGGAC GACGTTCGTC 
ACGCGGATGG ACTACCTGTC CCCGCTCTAC AACGAGGCCG GCTACTGCAT GGCGGTCGAG 
AAGCTGCTCG GCGTCGAGGC GCCGCAGCGG GCCCAGACCA TCCGCGTGCT GGTCATGGAG 
CTCAACCGGA TCGCCTCGCA CCTGGTCGCG CTGGCCACCT TCGGCATGGA GATGGGCGCG 
CTCACCGGGA TGACCAACGG CTTCCGCGAG CGGGAGCTCG TCCTGGACCT GCTCGAGGAG 
ATCACCGGGC TGCGGATGAA CCACGCCTAC ATCCGCCCCG GCGGGCTGGC GCAGGACCTC 
CCGCCCGGCG CGGTCGAGCA CATCCGGGAG TTCCTGCAGG TCATGCCGGA CCGGGTCGCC 
GACTTCCACA AGCTGCTCAC CGGCCAGCCG ATCTGGCAGG CCCGGCTCAA GGACGCCGGC 
TACCTCGACG TCACCGGCTG CGTGGCGATG GGCGTCACCG GGCCGGTGCT GCGCGCGGCC 
GGGCTGCCGT GGGACCTGCG CAAGGTCGAG CCCTACCTGG GCTACGAGAC CTACGACTTC 
GAGGTGCCGA CCGCCGACAC CTGCGACGCC TGGGGCCGCT ACCTGGTCCG CATGGCCGAG 
GTGAACGAGT CGCTGAAGAT CATCGAGCAG GCGCTGGACC GGCTGGAGCC GGGGCCGGTC 
ATGGTCGAGG ACAAGAAGAT CGCCTGGCCC GCGCAGCTGT CGCTGGGGCC CGACGGCATG 
GGCAACTCCC TGGAGCACGT CAAGCACATC ATGGGGCAGT CGATGGAGGC CCTCATCCAC 
CACTTCAAGC TGGTCACCGA GGGCTTCCGG GTGCCGGCCG GCCAGGTCTA CGTGCCCATC 
GAGTCGCCCC GCGGCGAGCT GGGCTACCAC GTGGTCAGCG ACGGCGGCAC CAGACCGTGG 
CGGGTGCACG TGCGCGACCC CAGCTTCGTC AACCTGCAGG CGACGGCGGC GATGAGCGAG 
GGTGGCATGA TCGCCGACGT CATCGCCGCG ATCGCCTCGC TCGACCCGGT GATGGGCGGG 
TGCGACCGAT GA

Protein sequence

MSTTYNPADP YAGSRETTEG RVYTVTGGDW DQTLGTEAYG EERLVVNMGP QHPSTHGVLR 
LVLDLEGETV TKARVVIGYL HTGIEKNTEY RNWTQGTTFV TRMDYLSPLY NEAGYCMAVE 
KLLGVEAPQR AQTIRVLVME LNRIASHLVA LATFGMEMGA LTGMTNGFRE RELVLDLLEE 
ITGLRMNHAY IRPGGLAQDL PPGAVEHIRE FLQVMPDRVA DFHKLLTGQP IWQARLKDAG 
YLDVTGCVAM GVTGPVLRAA GLPWDLRKVE PYLGYETYDF EVPTADTCDA WGRYLVRMAE 
VNESLKIIEQ ALDRLEPGPV MVEDKKIAWP AQLSLGPDGM GNSLEHVKHI MGQSMEALIH 
HFKLVTEGFR VPAGQVYVPI ESPRGELGYH VVSDGGTRPW RVHVRDPSFV NLQATAAMSE 
GGMIADVIAA IASLDPVMGG CDR