Gene Clim_1843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1843
Symbol
ID	6355184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2020551
End bp	2022326
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	54%
IMG OID	642669447
Product	polysaccharide biosynthesis protein
Protein accession	YP_001943861
Protein GI	189347332
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.12137
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCCA TCATGGACAA AAACGAAACC GTACAAAAAA AAATTGCCGG GAATGCCCTC 
TCAGGCATGG CAGCCACCAG CTTCTACCTT GTCACGAGGC TGCTGCTCAC CCCCTTCCTG 
CTCAGTCATC TCACCCTGGA GGAATTCGGT CTCTGGTCGC TCTGTTTCAT CATCCTGTCC 
TACGCATCCA TGGGAGGATT CGGCGTCAAC AGCACCTATA TCCGCTACAC GGCCCGATAC 
CACGCCGAAG CTCAGGAAGA ACAGATCAGC CGGCTGCTCT CAACGGGCAT TGCCTACATG 
CTGGTCTTCT GCCTCATTTT CTGTACTGCG CTCGTCATCA GCATGCCCCT CGTTCATCAC 
ATCTTTCACA TCGCAGCTGA AAAACGCGCC TCAGCCGCAA CCATCTTCAT AGGCACGGCA 
ATAGTCTTCA GTCTCGAACT CATACTCGGA GGATTCCGAT TCATCATCGC CGGCATGCAT 
GAAATAGCAA AAGAAAAACA GATCGCCACC TTCGCCGGAC TTCTTGAAAT AGGTGCAATC 
ATCGTCCTGC TGCTCTACGG ATTCGGCATC ATGGGGCTCC TGTACGCCTA TGCGTTACGA 
GTGATTCTTG AAACCCTCAG CTACCGGAAA TACGCAAAAA CAAAGCTTCC GCACCTGCGA 
ATATCGACAA AACTGGTAAA CCGGGAACAC CTGAAACTCT TCTTTGTTTT TGGGGGCAAG 
GTCCAGGTGC TCGGAGCCGG AGGCATCTTT CTTACAGCGC TCGACAGGCT TTTCGTAACC 
GCCTATCTCG GACTCGCCTC CGGAGGCTTG CTTGAAATCG GACGGAAACT GCCGTTTACG 
GCAAAAAAAA TCGCCGAATC GGCTTTCGGC CCCTTTCTGC CTGCTGCATC GCATCTTGAT 
GCATCCTGGG AAAAAGAGGT ACAAAATGCG CCTGCCACCC GCATACGCAC ATACGGCAAA 
ATCGCGCTTC TGATGTTCGC TGCGGGATTG ACGCCCGTCA TCTTTCTACC CTCGGTCGCC 
GAAAAGCTTC CGTTTCCGTC CCTGACCGCA GCGATACTCT CCGCAGGGGC AGCAACAGCC 
CTTTTCCTCA TACTGAAGAA CCAGCGCATA AACGACGAAC AGCTCAAGAA AGGCGAACTG 
AAGCAGCTCT ACCTCAATGG CCTCCGCTAC ACAAACATCA TCAGCAGCAC GATATTCGCC 
TATCTTGCCG CCTCGGCCAT GCCGCTGATC ATCGCCTGGG TCGGTCCGCA ATACCGCGAA 
GCCGCGATAA TCATGATATG CCTCTCGATA GCATACGCCG CTCAACTCTC AACCGGCCCT 
GGCAACATGA TCTTCCGCGG CATCAACAGG AACGGCCGGG AATTCGAATA CATGCTCGCG 
CAGCTCGTGC TCATACTGCT CTGGCTTCCT GCAGCAATCA AATCCTGGGC ACTGATAGGC 
GCAGCAGCCT CTCTTGCCGC AGCCTCGACA ACCAGCGCAC TGTTTTTCTT CTGGAGAAGC 
AACTACACCT TTCAGACAAC CTTTCGGGAA ATCTTGGGCC ATACGCTGCT GCCTGCTCTC 
GTTCCGCTCG TACCGGCATC ACTTGTTTAT GCGGCAACCT CACTGTTCCC CGCAGAAAAC 
CGACTCGCAG CCATCATTAC CATCCTGATT TCCGGCACGC TCTACCTTCT TCTGACCGTC 
GCCATGCTAT GGATCATGGT TCTCACTCAT GACGAAAAAC AAAAGGCAGG CGTGCTGCTC 
CGGTTTACTT CGATCAGCAG AAGCAAGAAC CAATGA

Protein sequence

MTAIMDKNET VQKKIAGNAL SGMAATSFYL VTRLLLTPFL LSHLTLEEFG LWSLCFIILS 
YASMGGFGVN STYIRYTARY HAEAQEEQIS RLLSTGIAYM LVFCLIFCTA LVISMPLVHH 
IFHIAAEKRA SAATIFIGTA IVFSLELILG GFRFIIAGMH EIAKEKQIAT FAGLLEIGAI 
IVLLLYGFGI MGLLYAYALR VILETLSYRK YAKTKLPHLR ISTKLVNREH LKLFFVFGGK 
VQVLGAGGIF LTALDRLFVT AYLGLASGGL LEIGRKLPFT AKKIAESAFG PFLPAASHLD 
ASWEKEVQNA PATRIRTYGK IALLMFAAGL TPVIFLPSVA EKLPFPSLTA AILSAGAATA 
LFLILKNQRI NDEQLKKGEL KQLYLNGLRY TNIISSTIFA YLAASAMPLI IAWVGPQYRE 
AAIIMICLSI AYAAQLSTGP GNMIFRGINR NGREFEYMLA QLVLILLWLP AAIKSWALIG 
AAASLAAAST TSALFFFWRS NYTFQTTFRE ILGHTLLPAL VPLVPASLVY AATSLFPAEN 
RLAAIITILI SGTLYLLLTV AMLWIMVLTH DEKQKAGVLL RFTSISRSKN Q