Gene Cag_1670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1670
Symbol
ID	3747264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2168358
End bp	2169488
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	47%
IMG OID	637774208
Product	glycosyl transferase
Protein accession	YP_379965
Protein GI	78189627
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAG CTTTATACGC AGGAACCTAT GTAAAAGATA AAGATGGTGC GGTACGCTCC 
ATCTATCAAT TAGTAAACTC TTTTAAAAAA GCAGGAGTTG AGGTTGTTGT ATGGTCGCCC 
GATGTTGACC CAACCTACAA TCATGGTAGC TTAGTGGTGC ACCAAATGCC TGCAATGCCC 
ATTCCCCTTT ATCCCGATTA CAAGCTTGGC TTTTTTTCTC GCGCTACTCG CCAGCAGTTA 
GATGCTTTTG CGCCCGACAT TATCCACATT TCAACCCCCG ATATTATTGG ACGCACTTTT 
TTGCTTTACG CTAAAGAGCG TGCTATTCCT GTAGCTTCAG CTTTCCATAC CGATTTCCCT 
TCTTATCTTG AATATTATCA TCTCGGCTTT GCGGTAAAGC CAACATGGCG CTATTTGCGC 
TGGTTTTACA ACAAGTGCGA TGTTACGCTT GCTCCAAACG AAAGCGTTCA GCAAAAGCTC 
GAAAGCCATG GAATTACCAA TGTGGCAAGC TGGTCGCGCG GCATTGATAA AGAGCTGTTT 
GATCCATCGC GCCGATCGGA AGCTCAGCGT GCAACGTGGA AAGTGGATGG CAAAACGGTG 
TTTATTTATG CAGGGCGCTT TGTGCCCTAT AAGGATACGG AGGTGGTTAT GCAGGTGTAT 
GAGCGCTTTA TGCAGAGTGA CTACGCAAAT CGTGTTGCTT TTGTGATGAT TGGCTCTGGA 
CCTGATGAAG AGGAGATGTG TCGCCGAATG CCCGATGCTA TTTTTACGGG CTATTTAACG 
GGTGCTGATT TGCCCACAGC TTATGCGTGT GGCGATCTCT TCTTTTTTCC CTCAACAACC 
GAAGCTTTTT GTAATGTAAC CTTAGAGGCG TTAGCGTGTG GCTTGCCTTC CATTGTTTCG 
GATGTGGGCG GATGTCGTGA TGTGGTTGAA CGATCCTCAG CGGGTTTGGT GGCACGTAGC 
GGCAATAGCG ACGATTTTTA TGCGAAATGC CTTGAATTGC TCAATAACCC TGAACGCTAT 
CAAGTAATGC GTGAACGGGG TTTAGCTTAT GCCGAACAGC AATCGTGGGC AGCCGTAAAT 
GGTGCTTTAA TTGAACGGTA TCGGCGGATG GTAAATCAAG CGCAACGCTA A

Protein sequence

MKIALYAGTY VKDKDGAVRS IYQLVNSFKK AGVEVVVWSP DVDPTYNHGS LVVHQMPAMP 
IPLYPDYKLG FFSRATRQQL DAFAPDIIHI STPDIIGRTF LLYAKERAIP VASAFHTDFP 
SYLEYYHLGF AVKPTWRYLR WFYNKCDVTL APNESVQQKL ESHGITNVAS WSRGIDKELF 
DPSRRSEAQR ATWKVDGKTV FIYAGRFVPY KDTEVVMQVY ERFMQSDYAN RVAFVMIGSG 
PDEEEMCRRM PDAIFTGYLT GADLPTAYAC GDLFFFPSTT EAFCNVTLEA LACGLPSIVS 
DVGGCRDVVE RSSAGLVARS GNSDDFYAKC LELLNNPERY QVMRERGLAY AEQQSWAAVN 
GALIERYRRM VNQAQR