Gene Cag_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1023
Symbol
ID	3746751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1377302
End bp	1378519
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	47%
IMG OID	637773552
Product	glycosyltransferase-like protein
Protein accession	YP_379328
Protein GI	78188990
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCCAGC AACGAAAACC TCGCCTACTT TGGGCGAACC TCTATTGCTT GCTTGATTCG 
TCGAGTGGCG CCTCCATTTC GGTACGAGAA ATGCTACGCC AACTTGCTTA CAATGGCTAT 
GAGGTTGAGG TAATTGGTGC AACTATTTTC GATGCTGTTA GCGGCATGAG CGCACTTCCA 
CCCCAATGGA AAAAGCGTCT TGAAACCACC GATATTCTTG AACTGAACGA TGCTCCTCTT 
CGTCATAAAT TGTTGATGAC CAACAGCCAT CAACGCGATG CCGTAACGGC GCTTGAAGAG 
GCTAAATGGT ACGAATTTTA TCTCCACACG CTCAATACGT TTAAACCCGA TGTAGTCTGG 
TTTTATGGTG GCAGACCGTT TGACTACCTC ATTTCCGACG AAGCCAAACA TCGTGGTATT 
CCTGTTGCCG CTTACCTTGT GAATGGCAAC TACACCAAAA CCCGTTGGTG TAGGGATGTT 
GATTGCATTA TTACCGATAC GCAAGCGACG GCTGATTATT ACCATCGAAA AAACGGTTTG 
ACGTTGACAC CGGTTGGCAA GTTTATTGAT CCAAAGATGG TGGTGGCTGC GGAGCATCTC 
CGACGAAATG TTCTTTTTGT AAATCCAACA TTTGAAAAAG GGGCAGCGCT TGTTGTGCAG 
ATTGCTTTGC AGCTTGAGCA GCTACGTCCC GACATTCAGC TTGAAGTGGT TGAGTCGCGA 
GGAAGTTGGC GAGGCATGGT TGAGTATGTG AGTGCTCGTT TGGGCAAGCC ACGTACTGGA 
TTAAGCAATG TGCAGGTTAT GCCGCACAGC CGCAATATGC GTCCGCTTTA TTCGAGAGCG 
CGAATGGTGC TGGCACCAAG CTTGTGGTGG GAAAGTGGTT CACGAGTGCT TGCCGAAGCA 
ATGCTGAACG CTATTCCTGC CCTTGTTACC GATAATGGAG GAAACCGTGA AATGGTTGGT 
GAGGGGGGTA TTGCCATTGC GCTGCCTGCG AACTATCATG CCAAGCCATA TATCGAGTTG 
CTGACTTCCG AATTGCTGGA GCAGTTTGTA GCACAGATTA TTTGCTGTTA TGATGATGAG 
CAGTTTTATC AAACGCTGGT TGCTCAAGCA ACGCTTTATG GTTGTACCAC GCATCACATA 
AGTACAAGCA CTCAGAAACT TCTCAAAGTA TTTGGGAAGT TAATCGCATC ATCTTCTAAA 
GAACTATCCT ATAAATAG

Protein sequence

MFQQRKPRLL WANLYCLLDS SSGASISVRE MLRQLAYNGY EVEVIGATIF DAVSGMSALP 
PQWKKRLETT DILELNDAPL RHKLLMTNSH QRDAVTALEE AKWYEFYLHT LNTFKPDVVW 
FYGGRPFDYL ISDEAKHRGI PVAAYLVNGN YTKTRWCRDV DCIITDTQAT ADYYHRKNGL 
TLTPVGKFID PKMVVAAEHL RRNVLFVNPT FEKGAALVVQ IALQLEQLRP DIQLEVVESR 
GSWRGMVEYV SARLGKPRTG LSNVQVMPHS RNMRPLYSRA RMVLAPSLWW ESGSRVLAEA 
MLNAIPALVT DNGGNREMVG EGGIAIALPA NYHAKPYIEL LTSELLEQFV AQIICCYDDE 
QFYQTLVAQA TLYGCTTHHI STSTQKLLKV FGKLIASSSK ELSYK