Gene Clim_1872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1872
Symbol
ID	6355213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2064180
End bp	2065823
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	56%
IMG OID	642669473
Product	glycosyl transferase group 1
Protein accession	YP_001943887
Protein GI	189347358
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000487215
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCTG CGATTTTATT TGAACCGGAT GGTTATGTGC TTTCCGGGGA AAAACTGATG 
GGTCGGCATG CTGCCGGTCA TGCTTTTCTT CGTGCTGCGG TTTCGGGCAG GGATGGCCTG 
CCGTTGTTGG CTTATACCCC GCATCGGGGT TCGTTCGATG TTTTTACCCG TCTTGTGCAT 
GCTTTCGATC CATCGGCTGA AACCCGGTGG ATTTCCGCAA ACAGGCTGGA TCTGCTGGAG 
CGGTCCGGTA CCCTGTATAT TCCCGGACCA GGCCTCGATA CTCAGGCCTG GCTGAGATTG 
CGCAGGGGTA TTACGGCTTA CAGCGTCTGC GGGGTGACGC ATACGACGGC TTCGCATGGT 
GCCATGGATT CGATTGCGGG TCTGCTGGAG GCTCCGGTTA TGGAGTGGGA TGCCTTGATC 
TGTACTTCGG AAGCCGTGCG GGAGAGTGTC CGGCTGGTAC TGGATGCCGG GCGCGATTAT 
CTGCAATGGC GGTTCGGTTC CGTCAGGCAA CTGACCATTC CGAAACTTCC GGTTATTCCG 
CTTGGAGTGC ATTGCGATGA TTTCCGCTTC GATGAAGCGG AACGCAAAGC TGCCCGTGAA 
GCTCTGGGGA TTTCTGACAG CGCTGTTGTT GCGCTGTTTG CCGGGCGCCT TTCTTTTCAT 
GCCAAAGCTC ATCCTTTCGC TATGTATGCC GCATTGCAGC AGGTTGCGGA GAGGAGCGGC 
AGGGAACTGG TGCTGGTGCA GTCGGGTTGG TTTGCAAATG ATCATATCGG CAACGCATTC 
TCGTCGGGGT CAGAGCTGTT TTGTCCCGGG GTGAGAGTGC TCTGCACCGA TGGACGAAAG 
CCTGAAGAGC GTCGCAGGAG CTGGGCCGCC GCTGATCTTT TTATTTCGCT TTCGGATAAT 
ATTCAGGAAA CGTTCGGGTT GACCCCGATC GAGGCGATGG CGGCCGGCCT TCCCTCTCTG 
GTGACTGATT GGGATGGGTA CAGGGATACG GTCAGGGATG GTATCGACGG GTTCAGGATT 
GCGACCCGCA TGCCTGAAAA GGGATGCGGA AGTTTTCTTG CCGAGGCGCA TGAGAGCGGT 
TCGATGGGCT ACGATATGTA CTGCGGATAT GCATGTCAGC TGGTGTCGCT CGACATCTCC 
GCACTTGTTT TGCGGCTTTC CGAGCTATGC GGCAACCCTG AATTGCGGTT TTCGATGGGT 
ATTGCTGCAA GAAAACGGGC AGAAGAGGTG TTCGACTGGA GGGTGATTTT CAGTCGCTAC 
AAGGAGCTGT GGCAGGAACT GGATGCGGTT CGTGCCGCCG CGGTCGGTCG GTCGGGTGCA 
GTTCCGGCAT GTTCTCCTGC ACGGATGGAT CCGTTCACCG TGTTTCAGCA CTACAGCACC 
TTTTCGGTCA ACAGGCTTTC AGCGGTTTCT CTGCAGCCGG GTTCAGGCAT GCAGCACTAT 
CGACAGCGGC TTGCTCACCC GCTTTTCAGC TATGCTGCCG GGCTGCTTCC CAAACCGGGA 
GAGATGGAGC GTTTTTTTCT GTTTTTAATG GCCAGGGGTA CCTGTATTAT CGGTGATATT 
GCCCGGGAAA TCGGTCTCGA TGAGTCGAGT ATTATCAGAG CGGTCGTCAT GCTTGAGAAG 
ATGGATATTG TTACGATTTC GTGA

Protein sequence

MNSAILFEPD GYVLSGEKLM GRHAAGHAFL RAAVSGRDGL PLLAYTPHRG SFDVFTRLVH 
AFDPSAETRW ISANRLDLLE RSGTLYIPGP GLDTQAWLRL RRGITAYSVC GVTHTTASHG 
AMDSIAGLLE APVMEWDALI CTSEAVRESV RLVLDAGRDY LQWRFGSVRQ LTIPKLPVIP 
LGVHCDDFRF DEAERKAARE ALGISDSAVV ALFAGRLSFH AKAHPFAMYA ALQQVAERSG 
RELVLVQSGW FANDHIGNAF SSGSELFCPG VRVLCTDGRK PEERRRSWAA ADLFISLSDN 
IQETFGLTPI EAMAAGLPSL VTDWDGYRDT VRDGIDGFRI ATRMPEKGCG SFLAEAHESG 
SMGYDMYCGY ACQLVSLDIS ALVLRLSELC GNPELRFSMG IAARKRAEEV FDWRVIFSRY 
KELWQELDAV RAAAVGRSGA VPACSPARMD PFTVFQHYST FSVNRLSAVS LQPGSGMQHY 
RQRLAHPLFS YAAGLLPKPG EMERFFLFLM ARGTCIIGDI AREIGLDESS IIRAVVMLEK 
MDIVTIS