Gene Cag_0638 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0638
Symbol
ID	3747315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	909988
End bp	911106
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	40%
IMG OID	637773174
Product	NADH dehydrogenase I chain H
Protein accession	YP_378954
Protein GI	78188616
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.621422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTAA CTGCTTTATC GCAATTATCA CTCCCTCTTT TTATGGGCAC CACTCTTAAT 
GCTTGGTCAG ATGCACTTGC TGGTTTTACT CCTTGGGGTT TACCTGTAGG ATTGCTGATT 
ATTGCTGCTA TTCCCCTTGT GTTTATTGCT TTATATGCCT TAACCTATGG TGTGTATGGT 
GAGCGAAAAA TATCAGCTTT TATGCAAGAT CGCCTTGGAC CTATGGAGGT TGGTAAGTGG 
GGTATTTTGC AGACATTAGC CGATATTCTT AAGCTTTTAC AAAAAGAGGA TATTGTGCCA 
CTGTCAGCCG ATAAATTTCT TTTTGTTATT GGTCCTGGAG TGTTGTTTGT TGGTTCTTTT 
TTAGCATTTG CGGTGTTGCC ATTTAGCCCT GCATTTATTG GGGCAAGTCT TAATGTTGGT 
CTTTTTTATG CTGTTGGAAT TGTAGCACTT GAAGTAGTTG GTATTCTTGC CGCAGGTTGG 
GGATCGAATA ATAAGTGGTC GTTGTATGGT GCTGTTCGAA GCGTAGCCCA AATTGTGAGC 
TATGAAATTC CAGCATCAAT TGCATTGCTT TGTGGTGCTA TGATGGCAGG CACACTTGAT 
ATGCAAAAAA TTACGATCTT GCAATCGGGA GAACTTGGTT TTGCTCATTT TTATCTTTTT 
CAAAATCCAA TTGCTTGGTT ACCATTCCTT ATTTATTTTA TTGCTTCACT TGCTGAAACA 
AACCGAGCAC CATTTGATAT TCCTGAAGCT GAATCGGAGT TAGTTGCAGG ATACTTTACA 
GAATACTCAG GTATGAAGTT TGCGGTTATC TTTCTTGCTG AGTATGGTCG TATGTTTATG 
GTGTCGGCTA TTATTTCTAT TGTATTTCTT GGTGGCTGGA ATTCGCCGCT TCCTAATATT 
GGAGCTTTTG AGTTAAATAC ATGGACAAGT GGTGCGGTGT GGGGTGCATT TTGGATTATT 
ATGAAAGGAT TTTTCTTTAT TTTTGTGCAG ATGTGGCTTC GTTGGACACT CCCTCGTTTA 
AGGGTTGATC AGCTTATGTA TCTTTGCTGG AAAGTTCTTA CGCCGTTTGC TTTTGTCAGC 
TTTGTGCTGA CTGCACTATG GGAAATATAT GTTCCTTAG

Protein sequence

MTVTALSQLS LPLFMGTTLN AWSDALAGFT PWGLPVGLLI IAAIPLVFIA LYALTYGVYG 
ERKISAFMQD RLGPMEVGKW GILQTLADIL KLLQKEDIVP LSADKFLFVI GPGVLFVGSF 
LAFAVLPFSP AFIGASLNVG LFYAVGIVAL EVVGILAAGW GSNNKWSLYG AVRSVAQIVS 
YEIPASIALL CGAMMAGTLD MQKITILQSG ELGFAHFYLF QNPIAWLPFL IYFIASLAET 
NRAPFDIPEA ESELVAGYFT EYSGMKFAVI FLAEYGRMFM VSAIISIVFL GGWNSPLPNI 
GAFELNTWTS GAVWGAFWII MKGFFFIFVQ MWLRWTLPRL RVDQLMYLCW KVLTPFAFVS 
FVLTALWEIY VP