Gene Cag_0212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0212
Symbol
ID	3747800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	240892
End bp	242040
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	47%
IMG OID	637772739
Product	glycosyl transferase
Protein accession	YP_378533
Protein GI	78188195
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000843162
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTTTT TGCTGTTTCA AGTAGCTATT GCTTTTGCCC TCTTGGTGTT TCTTGCTATA 
GGTGTAGCAA ATCGCTACGA ACTTGGTCGC TTACGCCATG CTGCATTGCA ATCGAGAGTA 
CCTTTTGTTT CAATTCTTGT GCCAGCTCGC AACGAAGCGC ACAATATTGA GCGCTGTATA 
AATTCGCTCT TGCAACAGCG CTACGAGTCG TTTGAGGTGC TTGTGCTTGA TGATGGTTCA 
ACGGATGCAA CTCCAACACT TCTTGCGGAG CTTGCGCAAC ATGCAGGTGG AGTGTTGCAA 
GTGTTGCAAG GGGATCCGCT GCCGCAAGGT TGGCATGGCA AGGCGTGGGC GTGTCAGCAA 
TTAGGTGAGG CTGCACATGG CGATTTGCTC CTATTCACCG ATGCCGACAC GGTGCATCAT 
CCTACAGCGC TTGCTCGTTC TGTAGCGGCA TTGCAAGCCT CACAAGCCTC CATGCTCTCC 
ATGACGCCCT TGCAAACTAT GCACTCATGG TGGGAAAAAA TTGTGGTTCC ATTGGTTTAC 
GTGGTACTAA TGAACTTTCT GCCTTTGCGC TTTGTTCGTA CCACTTCAAT TCCAGCTTTT 
AGCTTTGCCA ATGGGCAGTT TATCCTTATT GAACGCACTA TGTATCGCCA ACTTAATGGT 
CATGCGGCTG TGCGCCAGCA GCTTGTTGAA GATGTGTGGC TTTGCATGGC AGTAAAAAAA 
GCTGGGGGGA GGGTCGTGGC AATAAATGGC GTTGACTTAG TGAGTTGCCG CATGTATCGT 
AGCGGCAAAG AGGTGTGGGA AGGTTTTTCT AAAAACATTT TTGCAGGGCT TGGTTACTAC 
CATAGTGCGC TCTTTGGATT ACTTGCTCTG ATTGCGTTGT TCTACATCAT ACCAATTGCC 
TTACTTACAA CATCGGTGGT GCAAGCCAAT TATAGCGCAA CACACTTTTG GTTACCATTG 
GTTCAGGTGG TATTAGCTTT TGCAAATCGT TGGCTTGTTG CCTTCACTTT TCACCAATCT 
CGTTTTATGG TATTTTTTCA CCCATTGACG ATGGTCGCTT TTTTTGCTAT TGCCTGCAAT 
TCGTGGTATT GGATTGTTTC GGGCAAAGGA GCTGGCTGGA AAGGACGCCG TTACCAATTT 
ACTGAGTGA

Protein sequence

MLFLLFQVAI AFALLVFLAI GVANRYELGR LRHAALQSRV PFVSILVPAR NEAHNIERCI 
NSLLQQRYES FEVLVLDDGS TDATPTLLAE LAQHAGGVLQ VLQGDPLPQG WHGKAWACQQ 
LGEAAHGDLL LFTDADTVHH PTALARSVAA LQASQASMLS MTPLQTMHSW WEKIVVPLVY 
VVLMNFLPLR FVRTTSIPAF SFANGQFILI ERTMYRQLNG HAAVRQQLVE DVWLCMAVKK 
AGGRVVAING VDLVSCRMYR SGKEVWEGFS KNIFAGLGYY HSALFGLLAL IALFYIIPIA 
LLTTSVVQAN YSATHFWLPL VQVVLAFANR WLVAFTFHQS RFMVFFHPLT MVAFFAIACN 
SWYWIVSGKG AGWKGRRYQF TE