Gene Clim_1873 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1873
Symbol
ID	6355214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2066204
End bp	2067490
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	55%
IMG OID	642669474
Product	glycosyl transferase group 1
Protein accession	YP_001943888
Protein GI	189347359
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000000113427
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGGCC GGGAAGGGCT TTTTTGGGGT GTCATGAATT TTTTGTTTGT CCACCAGAAT 
TTTCCGGGTC AGTTTCCTCA TGTTGCAAGG GCTTTGGCCG GGATGCCCGG TAACCGTGTG 
GTTGCAATTG CTGAGGAGAA GAATGTTGTT CAGCGGTTGC CGGTGCATCC GAACGTAGTG 
GTTAAAACCT ACCGGCAGGA GAAAGGCAGC GGTCGCGAAA CGCATCACTA CATTCGAGAT 
TTTGAAAGCG CTGTGCGAAG GGGTCAGACG GTTGCGCGTC TGGCGATTGA AATCAGGAAG 
TCGGGGTTTC ATCCTCATGT TGTCGTGGGA CATCCAGCCT GGGGTGAAAC CCTGTTTTTG 
AAGGATGTGT TTCCGAATGC GCGGCATATA TCGTATTTCG AGTTTTTTTA CCGGGCAGAC 
GGGGGCGATG TGGGTTTTGA TCCGGAGTTT CCTTCGGTGT TCGATGACCG GCTGCGGATA 
AGGGTCAAGA ATACTACCCA GCTGCTCAGC CTGGAGGCTG CCGATGCGGG GATCTCTCCT 
ACCCTCTGGC AGCAGAGCCG GTTTCCTGAA GAGTTCCATT CGAAAATCAG GGTGATTCAT 
GAAGGTGTCG ATACCGCATT CGTTCGCCCT GACCCTGATG CCGCAGTCGA GCTTGACGGT 
ATGACGCTGA AGAGGTGCGA TAAGGTGGTG ACGTTTCTCT CGCGGAACCT CGAGCCGTAC 
CGGGGGTTTC ATGTTTTTAT GAGGACACTG CCGTTGATCC AGAAGGCTTG TCCCGAAGCG 
AGGATCGTCA TTATCGGCGG CGATGGGGTG AGTTACGGCA GGAGGCTTCC TGAAGGGCAG 
ACGTACCGTG CGATGTATGC TGCAGAAGCT GGTGACAAGG TTGACTGGTC GAAGGTGCAT 
TTTACCGGCA GGGTTCCGTA TAACCGGTAT CTTTCGCTTC TGCAGGTTTC TTCGGCGCAT 
ATCTACCTGA CCTACCCGTT CGTGCTTTCG TGGTCGATGA TCGAGGCGAT GTCGCTCGGT 
TGCGCGCTGA TCGCTTCTGC GACGCCTCCG GTGCAGGAGG TGGTCGAGCA GGGTGAAAAC 
GGCATTCTTG TGGATTTTTT CGATCGGGAT GGCCTTGCCG CTGCGGTAGC CGATGCCCTC 
GACAATCCGG GAGCTTACGA GCCGATGCGG CAGAGAGCAC GCGAGACTGC TGTGGAGCGG 
TACGATTTGC GTTCGAAGTG CCTTCCGGAA ATGCTTCGGT ATCTGAGTGG GGAAGATGAT 
TGTGGGCTGT ATGCGGTTAG CGGTTAG

Protein sequence

MNGREGLFWG VMNFLFVHQN FPGQFPHVAR ALAGMPGNRV VAIAEEKNVV QRLPVHPNVV 
VKTYRQEKGS GRETHHYIRD FESAVRRGQT VARLAIEIRK SGFHPHVVVG HPAWGETLFL 
KDVFPNARHI SYFEFFYRAD GGDVGFDPEF PSVFDDRLRI RVKNTTQLLS LEAADAGISP 
TLWQQSRFPE EFHSKIRVIH EGVDTAFVRP DPDAAVELDG MTLKRCDKVV TFLSRNLEPY 
RGFHVFMRTL PLIQKACPEA RIVIIGGDGV SYGRRLPEGQ TYRAMYAAEA GDKVDWSKVH 
FTGRVPYNRY LSLLQVSSAH IYLTYPFVLS WSMIEAMSLG CALIASATPP VQEVVEQGEN 
GILVDFFDRD GLAAAVADAL DNPGAYEPMR QRARETAVER YDLRSKCLPE MLRYLSGEDD 
CGLYAVSG