Gene Cpha266_0965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0965
Symbol
ID	4570734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1105508
End bp	1106626
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	48%
IMG OID	639765568
Product	respiratory-chain NADH dehydrogenase, subunit 1
Protein accession	YP_911437
Protein GI	119356793
COG category	[C] Energy production and conversion
COG ID	[COG1005] NADH:ubiquinone oxidoreductase subunit 1 (chain H)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00465289
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGTAA TGGCTTTATC GCAAATCCGT ATTCCTCTGC TTATGGGTAA CAGTCTCAAT 
GCCTGGTCGG AAGCCCTTAC CGGTTTTTCG ATCTGGGGAT TTCCTCTTGG TCTTGTCATT 
CTTGCCGCCA TTCCGTTAGT TTTTATTGCG CTTTACGCTC TGACATACGG AGTCTACGGC 
GAACGGAAAA TTTCCGCATT CATGCAGGAC AGGCTTGGTC CGATGGAGGT TGGCAAATGG 
GGTATTCTGC AGACCCTTGC CGATATTCTC AAGCTTTTGC AGAAAGAGGA TATTGTTCCT 
GCCGCTGCTG ACAAATTTCT TTTTGTCGTT GGCCCCGGAA TTCTGTTTGT CGGCTCCTTT 
CTTGCATTTG CCGTGCTTCC GTTCAGTTCT GCTTTTATTG GTGCCAATTT AAATGTAGGC 
CTCTTTTATG CAATCGGCAT CGTATCCATT GAAGTGGTCG GTATTCTTGC TGCCGGCTGG 
GGATCAAACA ACAAGTGGTC GCTCTATGGA GCGGTTCGGA GTGTCGCCCA GATAGTCAGC 
TATGAAATTC CTGCCGGAAT TGCCCTTTTG TGCGGAGCCA TGATGGCAGG AACGCTTGAT 
ATGCAGCAGA TAACAATGCT CCAGTCCGGT CATCTCGGGT TTGCCCATTT CAATCTTTTT 
CAGTCGCCGA TTGCCTGGCT TCCTTTTCTG ATCTATTTCA TCGCTTCGCT TGCAGAGGTT 
AATCGGGCCC CTTTTGATAT TCCCGAAGCC GAATCCGAGC TTGTTGCCGG TTATTTTACC 
GAGTATAGCG GGATGAAATT TGCGGTTATT TTTCTTGCCG AATATGGTAG TATGTTTATG 
GTTTCAGCCG TTCTCTCCAT TGTTTTTCTT GGAGGCTGGA ACTCGCCTCT TCCCGATCTT 
GGCCCTGTAT CGCTCAATGC CATGACAAGT GGCCCTGTGT GGGGGGTCTT CTGGATTATT 
TCGAAGGGAT TTTTCTTTAT TTTTGTGCAG ATGTGGCTGC GCTGGACCCT GCCTCGTTTG 
AGGGTTGATC AGTTGATGTA CCTCTGCTGG AAAGTTCTGA CACCGTTCGC TTTTATCGGA 
TTTGTTCTGA CGGCGATCTG GGAAATTTAT GTGCCATAG

Protein sequence

MSVMALSQIR IPLLMGNSLN AWSEALTGFS IWGFPLGLVI LAAIPLVFIA LYALTYGVYG 
ERKISAFMQD RLGPMEVGKW GILQTLADIL KLLQKEDIVP AAADKFLFVV GPGILFVGSF 
LAFAVLPFSS AFIGANLNVG LFYAIGIVSI EVVGILAAGW GSNNKWSLYG AVRSVAQIVS 
YEIPAGIALL CGAMMAGTLD MQQITMLQSG HLGFAHFNLF QSPIAWLPFL IYFIASLAEV 
NRAPFDIPEA ESELVAGYFT EYSGMKFAVI FLAEYGSMFM VSAVLSIVFL GGWNSPLPDL 
GPVSLNAMTS GPVWGVFWII SKGFFFIFVQ MWLRWTLPRL RVDQLMYLCW KVLTPFAFIG 
FVLTAIWEIY VP