Gene Cag_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1863
Symbol
ID	3747015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2371911
End bp	2373047
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	49%
IMG OID	637774400
Product	glycosyl transferase, group 1 family protein
Protein accession	YP_380156
Protein GI	78189818
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCAT ATAAGCTGCT TTGGTTTTCT GAAATACAGT GGGATTTTCT TTCAACCCGC 
AAACAACGCT TGTTGGCACG CTTTCCTGAC GAGTGGCATA TCTTATTTAT TGAACCCTTT 
ACGCTTGGGC GAAAACATCA TTGGTTGCCC GTAAAGCGAG GGCGCGTGTG GGTAGTTACC 
GTGCCGTTCC TTAAAACTAT TCCGTTTCGC TTTGGTGCTT TACTGAAGCG CCCCTTAGTG 
CGCACGCTTG CGGGATTGCC GGGCATTGCC ATCATGCACC TTTGGACGCT GTTGCTGGGC 
TTCAGTTCAT CACAACGTAT TATTGCGCTC AGCAATCCCT ATTGGGGGAA GGTTGCCTCA 
CACCTCCCCT GCCGATTCCG CTGTTACGAT GCCAACGATG ACCATCTTGC CTTTCCCTCC 
ACTCCCTCTT GGTTACCTGA TTGGCTTCAA CGCTACCTTT CAACAACATC GTTGGTTTTT 
AGTGTCAGCA AAGAACTGAC GGCTCGGCTT CCACTCTCTT CTTCCACAAA AGTTGTTGAG 
TTAGGTAATG GTGTTGAGTT CAACCACTTT GCAACTCCTC GCCAAAACAA ACCATCACAA 
CTTGCAGCGC TTTCAGGAAA AATTCTTGGC TATGCGGGAG CAATGGATTG GCTTGATGTT 
GATTTGCTTG AAAAAGTAGC TCAAACCTAT CACCAATATC ATCTTGTACT GCTTGGTCCT 
GCTTACGAGC ATGGATGGAT GGAACGGCAG TTAGGGTTGC AAGCGCTGCC CAACGTGCAC 
TATTTCGGCA AAATTGAGTA CAGCGAATTA CCTGCATGGG TGCAAGCTTT TAGCGTTGCG 
CTTATGCCGC TTGTTGCCAA TCCACTGAAA CAAGTGTCGC ATCCCAACAA GCTTTACGAA 
TATCTTGCAA CGGGCGTGCC TGTGGTTGCT ATGAACTATT GCAGTGCAGT GGAAGCAGCG 
GCTGACGTGG TGCATGTTGC TCAGTCGTAT GAAGAGTTTG TGCAGCTTGT GCCCATTGCG 
TTGGCTGATA ATCGTCGTGA AGCACGGCAG GCATTTGCAA AGCAGCATAG CTGGGATGCA 
CTTGCGGCTA CGATGGTTCA CGAGTTACAA CATGCTTGGC AGGAGAGTGC GCCATGA

Protein sequence

MKPYKLLWFS EIQWDFLSTR KQRLLARFPD EWHILFIEPF TLGRKHHWLP VKRGRVWVVT 
VPFLKTIPFR FGALLKRPLV RTLAGLPGIA IMHLWTLLLG FSSSQRIIAL SNPYWGKVAS 
HLPCRFRCYD ANDDHLAFPS TPSWLPDWLQ RYLSTTSLVF SVSKELTARL PLSSSTKVVE 
LGNGVEFNHF ATPRQNKPSQ LAALSGKILG YAGAMDWLDV DLLEKVAQTY HQYHLVLLGP 
AYEHGWMERQ LGLQALPNVH YFGKIEYSEL PAWVQAFSVA LMPLVANPLK QVSHPNKLYE 
YLATGVPVVA MNYCSAVEAA ADVVHVAQSY EEFVQLVPIA LADNRREARQ AFAKQHSWDA 
LAATMVHELQ HAWQESAP