Gene Clim_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1024
Symbol
ID	6353726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1127811
End bp	1129004
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	57%
IMG OID	642668647
Product	putative iron complex transport system substrate-binding protein
Protein accession	YP_001943078
Protein GI	189346549
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.264421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGC AGATGAGATT CGTTTCATTC CGGATCATGC GGGCAGTACT GGTGACGGTA 
CTGCCCCTTC TGCTGCTGGC GGGGTGCCGG CAGGAGCGGG AACGGCCGGT CAGAAGGGCT 
GCGAAGAGGG ACGTGGAGCA GGAAATTCCC CTGCGTTACG CCCGCCGTTT TACCATGAAA 
AAGGTTGGTT CCTGTACCCT CATCGAGATC AGGAAGCCGA AGGGGGCCAG GCTCGGGGTG 
TTCTATCGCT ATCTGCTCGT TCCCGAAGGA GAAACCGCGC CTTCCGGGTA TCCTGACGCC 
CTGGTTGTGG CTACTCCTGT CAGGAAAGTA ACCTGCGGTC TGGGGCTGCA GGTAGCCATG 
ATCGGGCAGC TCGACCGGAT TGAAAGCATA GCGGGGGTGG GCATGGGGAA GTGGACGGGA 
AACCCTGAGA TCCGCCGGAA GATGGCTGCC GGAGAGGTGC TCGAGACGGG CATGTCCGCC 
GATATGAACA TGGAGGCCAT GGTGAGCATC GACCCTGATA TCGCCTTCGT CTACTCGTCG 
GGAAGCGATA CCGACATCCA TGACAAACTG CTTTCGATGG GCATCAGGCC GGGGCTGGTG 
TGCATGCACC TCGAGGAGCA TCCTCTCGGC GTTCTGGAGT GGATACGGTT TTTCGGTGCG 
TTTTATGGCA GGGAGAAGGA GGCGGAGGCC TGTTTCAGGA GCGCAGCGGA ACGTTATGAA 
AAACTCGAAA CATCGGTGAA GGATTCTTTC AGCGTGTGTC CGACGGTTAT TGTCGGCCAC 
GCCACCAGAG GCATCTGGAC CACGCATGGT TCGAGCGCAT GGTTCATCAG GTTCCTGCAC 
GACGCAGGAG CGCGCTACAT ACTCGAAGAG AGCGGCGAAT ACGAAGAGAA TCCGGTCAGT 
CTCGAACACG CCCTCAAGGT CGGCATCGAA GCCGAATACT GGGTCAATCC CCGGTACAAT 
GCGAAAACCA TTACCGACCT GCTTGGCGAT GACAAGCGCT ATCAGTATTT CTCTTCGGTC 
AAATTCGGCA AGGTGTTCAA CAACGATAAC CTCACCTTCG ACGACGGACG GACGCTGTTC 
TGGGAGACGG GCATGATGGA ACCGGACGAA GTGCTCAGGG ATCTCGTCGC GATTTTTCAT 
CCCGGGCTGG TTCCGGGGCA TCGAATGAAA TACTATCGCA GGATGATGCG CTGA

Protein sequence

MEKQMRFVSF RIMRAVLVTV LPLLLLAGCR QERERPVRRA AKRDVEQEIP LRYARRFTMK 
KVGSCTLIEI RKPKGARLGV FYRYLLVPEG ETAPSGYPDA LVVATPVRKV TCGLGLQVAM 
IGQLDRIESI AGVGMGKWTG NPEIRRKMAA GEVLETGMSA DMNMEAMVSI DPDIAFVYSS 
GSDTDIHDKL LSMGIRPGLV CMHLEEHPLG VLEWIRFFGA FYGREKEAEA CFRSAAERYE 
KLETSVKDSF SVCPTVIVGH ATRGIWTTHG SSAWFIRFLH DAGARYILEE SGEYEENPVS 
LEHALKVGIE AEYWVNPRYN AKTITDLLGD DKRYQYFSSV KFGKVFNNDN LTFDDGRTLF 
WETGMMEPDE VLRDLVAIFH PGLVPGHRMK YYRRMMR