Gene Clim_2240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2240
Symbol
ID	6355263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2467204
End bp	2468274
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	55%
IMG OID	642669832
Product	GTPase EngC
Protein accession	YP_001944243
Protein GI	189347714
COG category	[R] General function prediction only
COG ID	[COG1162] Predicted GTPases
TIGRFAM ID	[TIGR00157] ribosome small subunit-dependent GTPase A

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGAAAT TGAGCGATCT TGGTTTTGAC CCCTGGTTTG AAACACATGC AGATGCAATC 
CGTTCCGAGG GTCAGAGCGT GGCACGTGTT TCGGCGGTTG ACCGGAATTC CTGCATGATC 
AGAAATGAAC AGGGGGAGAT TCCTGCCGAA CTTTCGGGGA AGTTTCTGTT CAATGTCGAG 
TCGCCGGCAG ATCTGCCATG CGTCGGGGAC TGGGTTGCCG TGCAGTATCA CAATGACGGC 
GCCCTTGCAA TCATTCATGG GCTCTTTCCC CGGAGGACGT TTTTACGCCG GAAGCGAGCC 
GGCACGGAGG TGGACTACCA GATGATAGCC GCAAATATCG ATATCGCCTT TGTCGTGCAG 
TCATGCCACT TCGACTTCAA TCTGGCGAGG CTGAACCGGT ATCTGGTGAT GGCGGCTGAC 
GGTCATGTCG AGTCGATTGT CGTGCTTGCC AAAACGGACC TGATCTCCGG TGAAGAGCTT 
CAGGAGAAGC TTGCGGCTAT CAGAGAGGCG GGCATTTCGG CCAGGGTGAT TGCGCTCAGT 
AACCTGAACG GTTCCGGATT TGAAGAATTC CGTCAGCTGC TGCTGCCGCG AGGAACCTAT 
TGTCTGCTTG GTTCCTCCGG AGTCGGCAAG ACGACGCTGA TCAATCATCT GATCGGACGG 
GATGATTTCG ATACGAAAGC GGTCAGCGGA ACAGGAGAGG GCACGCACAC GACGACGCGT 
CGGCAACTCA TTGTGCTTGA TGAAGGCAGT ATGTTCATCG ATACGCCGGG AATGAGAGAG 
TTAGGCCTTT TGGGCGCCAG TGAAGGGGTA AACAAAGGGT TTGAAGATAT CACTGGGCTT 
TCCAGAGCCT GCCGGTATGC CGATTGCAGC CATACCGGGG AGTCGGGTTG TGCAGTGCTT 
GCTGCAATCG AAGCCGGAGA GCTGAGCGAA GAGCGCTATG CCGGTTATCT GAAACTCAGG 
AAGGAGTCGG AGTACCACGA GCTGTCGTAC CTTGACAAAC GAAAAAAGGA GCGGGCATTC 
GGTCGCTTTA TCAGGACGGC CAAGAAGGAT ATGAAAAGAT GGGATGGTTA G

Protein sequence

MTKLSDLGFD PWFETHADAI RSEGQSVARV SAVDRNSCMI RNEQGEIPAE LSGKFLFNVE 
SPADLPCVGD WVAVQYHNDG ALAIIHGLFP RRTFLRRKRA GTEVDYQMIA ANIDIAFVVQ 
SCHFDFNLAR LNRYLVMAAD GHVESIVVLA KTDLISGEEL QEKLAAIREA GISARVIALS 
NLNGSGFEEF RQLLLPRGTY CLLGSSGVGK TTLINHLIGR DDFDTKAVSG TGEGTHTTTR 
RQLIVLDEGS MFIDTPGMRE LGLLGASEGV NKGFEDITGL SRACRYADCS HTGESGCAVL 
AAIEAGELSE ERYAGYLKLR KESEYHELSY LDKRKKERAF GRFIRTAKKD MKRWDG