Gene Clim_0680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0680
Symbol
ID	6354294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	752139
End bp	753506
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	52%
IMG OID	642668307
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_001942742
Protein GI	189346213
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0162365
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAG AAATCGGGAT ACTCGAAGGA AGACAGGGCC AGGTCTTCGA AAAGAAAAGC 
GGCGAGGCAG AACAGCTCGA TATCTCTTGT GAGAAAACAA GCCTGTCCGG ATCGGTCAGT 
CAGCGAGCCT GTGTGTTCTG CGGTTCCCGT GTGGTGCTCT ACCCTGTAGC CGATGCCCTT 
CACCTCGTTC ACGGCCCTAT CGGATGCGCA GCCTATACCT GGGACATCCG CGGCGCGGTA 
TCTTCAGGCC CGGAACTGCA CCGGTTGAGT TTCTCGACCG ACCTCGGAGA GATGGATGTG 
ATCTACGGCG GTGAAAAGAA ACTCTATCTT TCACTTATCG AACTGATCGA CAAGTATAAG 
CCCAAAGCGG CATTTATCTA CTCGACATGC ATTATCGGCC TTATCGGTGA CGATATCGAC 
GCCGTGTGCA AAAAAGTGTC GAAAGAGACC GGCATTCCAG TTCTGCCGGT TCATTCCGAA 
GGGTTCAAGG GAACCAAGAA AGACGGGTAT AAAGCTGCCT GCACCTCTCT CATGAAGCTG 
GTAGGCACCG GCTCGATCGA AGGGATCAGT CCTTACAGCA TCAATATTCT CGGCGAATTC 
AACCTTGCCG GCGAAGCATG GATCATCAGG GAATACTACG AAAAAATGGG CATCGAGGTT 
GTTTCCACCA TGACCGGTGA CGGACGTGTC GACGCCGTAC GCCGTGCTCA CGGCGCTACG 
CTCAACGTCG TGCAATGTTC CGGATCAATG ACCACACTTG CCAAAGAGAT GGAGGAAAAA 
TACGGCATTC CCTATATGCG CGTCTCCTAC TTCGGCATCG AGGACATGTC CAAATCGCTC 
TACGATGTCG CCAAACATTT CAGCGACCGG CCCGACATCA TGGATGCGGC AAAAGAGATT 
GTCAGCAAAG AGGTAGCGAA ACTCTACCCC GAACTGCAAA AATTCAAAAA AGTCCTGGCG 
GGCAAAAAAG CGGCCATATA TGTCGGTGGA GCATTCAAAA CCTTTTCGCT CATCAAGGCC 
CTGCGTTCGA TCGGCATGTC GGTTGTCCTT GCCGGATCCC AGACAGGCAA CAAGGATGAT 
TACGAGCGCC TCAGGGAGAT GTGCGACGAA GGAACCATCA TCGTTGACGA CTCGAATCCC 
GTCGAACTCT CGAAATTCGT GCTTGAAAAA GAGGCCGACC TGCTTATCGG TGGGGTGAAG 
GAGCGGCCGA TCGCCTACAA ACTCGGTATC GGCTTCTGCG ATCACAACCA CGAGAGAAAA 
ATTCCTCTGG CAGGATTTAT CGGCATGTAC AACTTCGCAA AGGAGGTCTA TCAGTCGGTC 
ATGAGCCCGG TATGGCAGTT CGCTCCGAGA AAAGGAGGCA AAATATGA

Protein sequence

MKEEIGILEG RQGQVFEKKS GEAEQLDISC EKTSLSGSVS QRACVFCGSR VVLYPVADAL 
HLVHGPIGCA AYTWDIRGAV SSGPELHRLS FSTDLGEMDV IYGGEKKLYL SLIELIDKYK 
PKAAFIYSTC IIGLIGDDID AVCKKVSKET GIPVLPVHSE GFKGTKKDGY KAACTSLMKL 
VGTGSIEGIS PYSINILGEF NLAGEAWIIR EYYEKMGIEV VSTMTGDGRV DAVRRAHGAT 
LNVVQCSGSM TTLAKEMEEK YGIPYMRVSY FGIEDMSKSL YDVAKHFSDR PDIMDAAKEI 
VSKEVAKLYP ELQKFKKVLA GKKAAIYVGG AFKTFSLIKA LRSIGMSVVL AGSQTGNKDD 
YERLREMCDE GTIIVDDSNP VELSKFVLEK EADLLIGGVK ERPIAYKLGI GFCDHNHERK 
IPLAGFIGMY NFAKEVYQSV MSPVWQFAPR KGGKI