Gene Caul_2828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2828
Symbol
ID	5900283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3070308
End bp	3071627
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	66%
IMG OID	641563320
Product	NADH dehydrogenase I subunit F
Protein accession	YP_001684453
Protein GI	167646790
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.256146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.149057
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGGTA TCCTCGAAGA CAAGGACCGC ATTTTCACGA ACCTCTACGG TCTCCAGGAT 
TGGGGCCTTG AGGGCGCGAA GAAGCGCGGC TGCTGGAATG GCACCAAGGA CATCCTGGAC 
GCCGGGCGCG ACTGGATCAT CGACAACATG AAGAACTCCG GCCTGCGCGG CCGGGGCGGG 
GCGGGCTTCG GCACCGGCCT GAAGTGGTCG TTCATGCCCA AGGAAGTGAA GGACGGCCGT 
CCGCATTATC TGGTCGTCAA CGCCGACGAA TCCGAGCCGG GCACCTGCAA GGACCGGGAG 
ATCATGCGGC ATGATCCGCA CCTCCTGATC GAAGGCTGCC TGATCGCCTC GCGCGCCATG 
CTAGCCCATG CCTGCTACAT CTACATTCGC GGCGAATATG TCCGCGAGCG TGAAGTGCTT 
GAGGCAGCGA TCAAGCAGGC CTACGAGGCC AAGCTGATCG GCAAGAACAA CGTCCACGGC 
TGGGACTTCG ACCTCTACGT CCACCACGGG GCCGGCGCCT ATATCTGCGG CGAAGAGACG 
GCCCTGCTGG AAAGCCTGGA AGGCAAGAAG GGCCAGCCGC GCCTGAAGCC GCCGTTCCCG 
GCCGGAGCGG GCCTCTACGG CATGCCCACC ACGGTCAACA ACGTCGAGAG CATCGCCGTG 
GCCGGCACGA TCCTGCGTCG CGGCGCAGCC TGGTTCGCGG GCTTTGGCCG TCCGAACAAC 
ACCGGCACCA AGCTCTTCTG CGTCAGCGGG CACGTGAACC TGCCCTGCAA TGTCGAAGAA 
GCGATGAGCA TCCCGTTCCG TCAGCTGATG GAAGACCACT GCGGCGGCAT TCGCGGCGGC 
TGGGGCAACC TGAAGGCCGT CATCCCGGGC GGTTCGTCCG TACCGATGAT CCCGGCCGAG 
CAGTGCGAAG ACCTGCCGAT GGACTTTGAC GCCCTGCGCA ACCTGCGCTC GGGCCTTGGC 
ACCGCCGCCG TCATCGTCAT GGACAAGGAC ACAGACCTCG TCCGCGCCAT CGCCCGCCTG 
AGCTACTTCT ACAAGCACGA GAGCTGCGGC CAGTGCACGC CGTGCCGCGA AGGCACCGGC 
TGGATGTGGC GGGTCATGGA GCGCATGGCC ACCGGCGAGG CCGATCCGAA AGAGATCGAC 
ACCCTGCTGG ACGTCACGAC CCAGGTCGAG GGTCACACCA TCTGCGCCCT GGGCGACGCG 
GCCGCCTGGC CGATCCAGGG CCTGTTCCGT CACTTCCGCC ACGAGGTGGA GGACCGGATC 
GCATCCTATC GTAGCGGTCG CCTGCACGTG CAGGGCGCCA GCCTGATCGC GGCGGAGTAA

Protein sequence

MVGILEDKDR IFTNLYGLQD WGLEGAKKRG CWNGTKDILD AGRDWIIDNM KNSGLRGRGG 
AGFGTGLKWS FMPKEVKDGR PHYLVVNADE SEPGTCKDRE IMRHDPHLLI EGCLIASRAM 
LAHACYIYIR GEYVREREVL EAAIKQAYEA KLIGKNNVHG WDFDLYVHHG AGAYICGEET 
ALLESLEGKK GQPRLKPPFP AGAGLYGMPT TVNNVESIAV AGTILRRGAA WFAGFGRPNN 
TGTKLFCVSG HVNLPCNVEE AMSIPFRQLM EDHCGGIRGG WGNLKAVIPG GSSVPMIPAE 
QCEDLPMDFD ALRNLRSGLG TAAVIVMDKD TDLVRAIARL SYFYKHESCG QCTPCREGTG 
WMWRVMERMA TGEADPKEID TLLDVTTQVE GHTICALGDA AAWPIQGLFR HFRHEVEDRI 
ASYRSGRLHV QGASLIAAE