Gene Clim_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1842
Symbol
ID	6355183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	2019415
End bp	2020554
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	53%
IMG OID	642669446
Product	polysaccharide export protein
Protein accession	YP_001943860
Protein GI	189347331
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.185865
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTACT ACAGCAGCGC CACAGCCCGA AGAAAACACT CGACACGCAC TGCCCGTCCC 
CTGGTGATCA TCTGCGCCGC CATGCACCTG CTGCTCCTGG CCGCCTGCGG CAGCATATCT 
CCGAAAGAAA CCACACAATA CGCTCCTCCG GAAAAAGAAT TCAAGGCAGA CATTCCGAAA 
AAAACGCAGG AATTCGCCAA ACCCTCGACC ATAAGAGATC TCACCCCGAT CGAACAGTTC 
AGTTACCGGC TCGGCCCTGG AGACATCCTC AGCGTGCAGG TATGGAGAAG ACCGGAGCTT 
TCACAAGAAA ACATCATGGT CTCGCCCGAC GGCAACATCG CCATTCCGAG AATCGGCAAC 
ATGAACGTGC TCAACCGAAC ACCGGCCGAA ATACAAAAAC TTATCACCGC CCGGCTCGAA 
GTGCTCTACA TCAGGCCGGA AATAACCGTT CGAGTCCAGG AATTTCACAA CAATAAAGCT 
TTCGTCCTGG GACGAGTCAC CAAACCCGGC GTCGTGAACT TCCCCGGCAG AGGCACCCTG 
CTCGAAGCGC TCGCACTCGC CGGCGGACTA CCCTATCAGG GTAAAGAAAC CTTCCTCACC 
AAATGCGCCA TCATCCGGGG CAACGATATC GTCATATGGA TCGACCTGCA GGATCTCCTC 
AAAAACGGAA ATATGGCGCT CAACGCATCC ATCATGAACA ACGACGTCAT CTTCATTCCC 
GAAGCTGAAG ATGAAATGAT CTACGTCATG GGAGAGGTCA TCACCCCCGG TGCCATACAG 
CTGAAAAGCA GCATGAACGT ACTTAAAGCC ATCATGCTGG CCGGGGGCAT GAACAAGCAC 
GCAAACCCCG AAAAAATCTT CATCATCCGC CAGCAGGACC TCAAAGGAAA CGTCATCAGG 
GTAAACCTGA AAAATCTGCT CGAAAAGGGC GACTTCGCCA AAAACTATAC CCTTCTGCCT 
GAAGACATCG TCTTCGTCAG CCCGAGCGGC ATGGCAAAAT TCAACTACAC CCTCGAAAAA 
CTCATCCCGG CGCTGCAGGT GCTCAACCTC GGTATCGACA ACTTCGAATC ATTCGGCCTC 
ATGCAGGAAT TGCGCAGAAA GCTCTGGGGA CAGGAAGGTT TCGTCAATTC CAGCGAATGA

Protein sequence

MQYYSSATAR RKHSTRTARP LVIICAAMHL LLLAACGSIS PKETTQYAPP EKEFKADIPK 
KTQEFAKPST IRDLTPIEQF SYRLGPGDIL SVQVWRRPEL SQENIMVSPD GNIAIPRIGN 
MNVLNRTPAE IQKLITARLE VLYIRPEITV RVQEFHNNKA FVLGRVTKPG VVNFPGRGTL 
LEALALAGGL PYQGKETFLT KCAIIRGNDI VIWIDLQDLL KNGNMALNAS IMNNDVIFIP 
EAEDEMIYVM GEVITPGAIQ LKSSMNVLKA IMLAGGMNKH ANPEKIFIIR QQDLKGNVIR 
VNLKNLLEKG DFAKNYTLLP EDIVFVSPSG MAKFNYTLEK LIPALQVLNL GIDNFESFGL 
MQELRRKLWG QEGFVNSSE