Gene Cagg_2161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2161
Symbol
ID	7267669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2654107
End bp	2655240
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	59%
IMG OID	643566992
Product	glycosyl transferase group 1
Protein accession	YP_002463480
Protein GI	219849047
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00492248
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTGTGG CGCTCATTGC CGAGACGTTT CTACCCGATG TCAATGGTGT AACGACAACG 
CTCTGTCGCC TCCTAGAGCA TTTACAGCGC ACCGGTCACG AAGCTGTGCT ATTCGCACCC 
CAAGGTGCGC CGACAAGCTA TGCCGGTGCA GAAATCGTAC CACTCAGCGG AATGCCGTTA 
CCGCTCTATC CTGAAGTCAA ACTCACTCCA CCACAACCCG GCCTAACGGC CCGCTTGCGT 
AGCTTTCAAC CCGACGTCGT GCATTTAGTC GGACCGGTAG TGTTAGGGGC AATTGTCCCC 
GGTATCGTCC GTCGGCTCGG ACTACCCCTG ATCGCCTCGT ACCACACCGA CTTTGGCGCA 
TACAGCCGAC ACTACGGTTT CGGTTTCTTA CAACACGGCG TCAATGCATG GCTGCGTTGG 
ATTCACAACC GTTGCCGGAT TAACCTTTGT CCTTCGAGTT TTACCCTTCA TGCTCTCCGT 
GCCGCCGGTT TTCGCCGCTT GCGGATTTGG GGACGCGGCG TCGATATCGA ACGGTTCCAC 
CCGCGCTATC GCAGTGAAGC GTGGCGGGCT GCTATCGGGA TACAACCGGG TGAGCGGTTA 
GTGCTCTATG TAGGTCGGGT AGCCGCCGAA AAGCGGGTCG ATCTGTTACC GGAAGCCATC 
CGCGGCCTGC CGAACGTCCG CCTCGTAATT GTCGGCGATG GACCCTTCCG CGCCGAGTTG 
CAACGGCGTT GCGCTGGTCT GCCGGTGCAT TTTACCGGTT ATCTTAAGGG AGAGGCTTTG 
GCGGTAGCTT ATGCAAGCGC CGATGCGTTT GTCTTCCCCT CCGATACCGA CACCTTCGGA 
CAAGTTATTC AAGAAGCGAT GGCTTCCGGC TTACCGGTCG TGGCTGCACG GGCCGGTGGT 
GCGATCGATC TGGTACGTCA CGGCCACAAC GGGTATCTGT TTACTCCCGG CGTTGTTACC 
GATTTGCGCG CCCGCCTCCG AGAACTACTC GCCAACGACA GCCGTCGGAT CACACAGGGG 
CTGGCCGGAC GCGCTGCTGC CGAACGACGA TCGTGGCCGA GTGTGATGGA TGAACTCATG 
GGGTATTACA CGCGAGCAAT GTCGCATCGC CGTTTGGGAA GACAACCAGG TTAG

Protein sequence

MRVALIAETF LPDVNGVTTT LCRLLEHLQR TGHEAVLFAP QGAPTSYAGA EIVPLSGMPL 
PLYPEVKLTP PQPGLTARLR SFQPDVVHLV GPVVLGAIVP GIVRRLGLPL IASYHTDFGA 
YSRHYGFGFL QHGVNAWLRW IHNRCRINLC PSSFTLHALR AAGFRRLRIW GRGVDIERFH 
PRYRSEAWRA AIGIQPGERL VLYVGRVAAE KRVDLLPEAI RGLPNVRLVI VGDGPFRAEL 
QRRCAGLPVH FTGYLKGEAL AVAYASADAF VFPSDTDTFG QVIQEAMASG LPVVAARAGG 
AIDLVRHGHN GYLFTPGVVT DLRARLRELL ANDSRRITQG LAGRAAAERR SWPSVMDELM 
GYYTRAMSHR RLGRQPG