Gene Snas_5252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5252
Symbol
ID	8886461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5577952
End bp	5579202
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID
Product	glycosyl transferase family 2
Protein accession	YP_003513979
Protein GI	291302701
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGACA CAGCGATCAG ATCCCAGGGC CTGCCGGTCC GCGCACCGAT CCCGGCGGGC 
CACTACGAAC CGGTCATCGA CGTCGTCATA CCCGTCTACA ACGAACAGGA CGATGTGGAG 
GCCAGTGTGC GACGTCTGCA CACCCATCTG GCCCGTACCT TCCCCTACGG CTACCGCATC 
ACGGTCGCCG ACAACGCCAG CACCGACGCC ACCCCCGCCA TCGCGGCCCG GCTGGCCGCC 
GAGCTGGCGC AGGTGGAGTT CGTCCGGCTG CCCGAGAAGG GCCGCGGCCG GGCGCTGCGC 
CAGGTCTGGT CGCACTCGAC GGTGCCGGTG CTGGTGTACA TGGACGTCGA CCTGTCCACT 
GACCTCAACG CGCTGTTGCC GCTGGTGGCA CCGCTCATCT CGGGGCATTC GGACCTCGCG 
ATCGGCACCC GGCTGGCACG CGGGTCGCGG GTGGTGCGGG GCGGCAAACG CGAGTTCATC 
TCCCGCACCT ACAACGCCAT CCTCAAGGGC GGCCTGGCGG CCGGGTTCTC CGACGCGCAG 
TGCGGTTTCA AGGCGATCCG CGCCGACGTG GCCGCCGAAC TGCTGCCGCT GGTGGAGGAC 
ACCGGCTGGT TCTTCGACAC CGAACTGCTG GTGCTGGCCG AACGCGCGGG ACTGCGCATC 
CACGAGGTCC CGGTCGACTG GGTCGACGAC CCCGACAGCC GCGTCGACAT CGTCCGCACC 
GCCGTCGACG ACCTCAAGGG AGTGTGGCGG GTGGGCCGGG CGCTGGCGTC GGGGGCGCTG 
CCGCTGTCGC GGCTGCGTCG CCCGTTCGGC GACGACCCGC GCGACCGCGA GACCTCGGGC 
GGCCTGGTGC GGCAGCTGCT GAGCTTCTGC GTCATCGGGA TACTCAGCAC CCTGTTCTAC 
CTGGTGCTGT ACACGGTATT CCGCGACGGA CTCGGGCCAC AGGTATCCAA TATGGTGGCG 
CTGTTGGTCA CCGCGATGGC CAGCACGGCC GTCAACCGCC GCTTCACCTT CGGGGTCCGG 
GGACGCGACG GTGCCGTCCG GCAGCAGGCG CAGGGGCTCG CGGTGTTCGC GATCGGGCTG 
ACTCTCACCA GCGGATCGCT GGCGGCACTG GAAATCGCGA GCCCGACGGC TGGCCAGACC 
ACCGAACTGG CCGTACTCGT CGTGGCCAAC CTCGCGGCCT CGCTGCTGAA GTTCCTGCTG 
TTTCGCGGTT GGGTCTTCCC GGCCGCCCGT ACCGAAAGTG AGGCGTCATG A

Protein sequence

MEDTAIRSQG LPVRAPIPAG HYEPVIDVVI PVYNEQDDVE ASVRRLHTHL ARTFPYGYRI 
TVADNASTDA TPAIAARLAA ELAQVEFVRL PEKGRGRALR QVWSHSTVPV LVYMDVDLST 
DLNALLPLVA PLISGHSDLA IGTRLARGSR VVRGGKREFI SRTYNAILKG GLAAGFSDAQ 
CGFKAIRADV AAELLPLVED TGWFFDTELL VLAERAGLRI HEVPVDWVDD PDSRVDIVRT 
AVDDLKGVWR VGRALASGAL PLSRLRRPFG DDPRDRETSG GLVRQLLSFC VIGILSTLFY 
LVLYTVFRDG LGPQVSNMVA LLVTAMASTA VNRRFTFGVR GRDGAVRQQA QGLAVFAIGL 
TLTSGSLAAL EIASPTAGQT TELAVLVVAN LAASLLKFLL FRGWVFPAAR TESEAS