Gene Clim_1868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1868
Symbol
ID	6355209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2053636
End bp	2054931
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	47%
IMG OID	642669469
Product	hypothetical protein
Protein accession	YP_001943883
Protein GI	189347354
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000000489897
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTTT CGCATGGAAA TCCTTATCGG GGTGAACATG GGTTGCCGGA TATCCTGTAT 
TTGTCACCGG ATGATTTCAC CGTCACTATT TCGCGGATGA ATCTGAATGC CGTCGATCAT 
GTGGCGAAAT GGACCATCCT GATTTATATG GCTGCCGATT GTGATCTTGC TGCGTTTATG 
TTTGATGACC TGATGGAAAT GAAGGTTGTC GGTTCGAATG AAGATGTAAA TATATGCGTG 
TTTTTCGATG GTCCTTTATT GACCGATACC TTTTTTGCAA GACTGTGCCA TGGGACGAGC 
CTTGAGGAGG ATATTATTCA ACGGTTTACC GATGTGCCAA GTTCGAATGT CGGTATTCTT 
AAAGAGATTA TTCTCAATAC TGCCGTACTT TTTCCTGCTG AAAGGAGAGT GCTTGTTTTA 
GCTGGTCACG GTTTGGGTTG GCGAGGAGCT TTGCGGGATG ATTCGACGTG GAAGCGTTTC 
AAGGAACGAA GGGCAATCGT TATGCCGTCA GGAGATTCCT CCGTTTTTTT CCGTCAGCTC 
GATGAGCAGA GACAAAGAGC GCTCGAGGAG TTGAAAGCCC GTCTGAATCC CCGGGACGAG 
CATCATGGAT CGGCATTTGA TATTATTGCC ATGGATGCCT GTAACATGGG TAATCTGGAG 
GCTTTGTCCT TTTATTCGGA TCACGCACGC ATTCTTGTGG CTTCAGAAAA CCAGGTGCCT 
GCATCAGGTT ACCCTTATGA TAGAATTCTT GAGGAACTGA AGAGAAATCC TGAACAGGAG 
TGTGACGCGT TTGCCCGCTA TCTTGTGAAC GAGGTGAAAC GCTATTATGT GGATTCAATA 
TTGTTATGCA GTGAGAGCGA TATAACGCAG GTTGCATTTG ACAGTACCGG ATTTCCGGCA 
TTGATTGCGC ATGCAGGAGA GCTTGCGCGC GTACTGTCGG AATATGTTTC TACTGAGGGC 
ATTGCAACGG TCAAGGCTTG TTCCGGAGCT TCTTTATTAC CTGAGGAGGA TACGGATTAT 
ATCGATTTGA GGCTTTTTGC GAAAGAACTG GTACAGGCAG GAGTTTCTGA TGCCGTAAAG 
CAGAAAGCGA TGGAACTGGT GGCTTTTTTT GATGGATCGG GATTTGTTGT GGGTAGTGCA 
ACTCCGGGTG GCGATGCATT GCCGAAGGGC CTTTCCATTT ATTTTCCGCC GCCGGAACGG 
TTCGATAAAG GGTATCTGGA TATTCTGAGC CACGTTCCTG AAGGTATCAG GTTGTGGGCT 
GGTTTTATTG GAGCGTACTA CGGGAAGAGA TTTTGA

Protein sequence

MIFSHGNPYR GEHGLPDILY LSPDDFTVTI SRMNLNAVDH VAKWTILIYM AADCDLAAFM 
FDDLMEMKVV GSNEDVNICV FFDGPLLTDT FFARLCHGTS LEEDIIQRFT DVPSSNVGIL 
KEIILNTAVL FPAERRVLVL AGHGLGWRGA LRDDSTWKRF KERRAIVMPS GDSSVFFRQL 
DEQRQRALEE LKARLNPRDE HHGSAFDIIA MDACNMGNLE ALSFYSDHAR ILVASENQVP 
ASGYPYDRIL EELKRNPEQE CDAFARYLVN EVKRYYVDSI LLCSESDITQ VAFDSTGFPA 
LIAHAGELAR VLSEYVSTEG IATVKACSGA SLLPEEDTDY IDLRLFAKEL VQAGVSDAVK 
QKAMELVAFF DGSGFVVGSA TPGGDALPKG LSIYFPPPER FDKGYLDILS HVPEGIRLWA 
GFIGAYYGKR F