Gene Sros_3832 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3832
Symbol
ID	8667122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4271103
End bp	4272344
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	77%
IMG OID
Product	glycosyl transferase, group 2 family protein
Protein accession	YP_003339494
Protein GI	271965298
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.956349
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0237391
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACCGC TCACCACGCT CCGCACCACC GCTCACCGCC CGGGACTCCT GGCCGCCCTC 
CACCGTGTAA GAGAGATCGC CCCGATGAGC CCGCTCACCG TGTTCCAGGC CGCCGCCGCC 
CTCGCCGTCG GGGTACGGCT GGCCCGCGGA CGCGACCGGC TGCCACCGCT GGCCCCCACC 
GGGGCGACGG CCGGGCGGAT CTCGGTGGTG ATCCCGGCCC GCGACGAGGA GGGCCGTATC 
GGCCCCTGCC TGTCGGCGGT GCTCACCGAT CCGGCCGTCG CGGAGGTCCT CGTCGTCGAC 
GACGAGTCGA GCGACGGCAC GGCGCGGCTG GCCGCCGATC TCGGCGCGAA GGTCGTCGTG 
GGCGCGCCTC TTCCGGAGGG CTGGGTGGGC AAGCAGTGGG CGCTGCTGCA GGGGGTCGAG 
GCGGCCGGCG GCGACATCGT GGTGACCCTC GACGCGGACA CCCGGCCCGC GCCGGGCCTG 
TTCGGCGCGC TGGCCGCGGC CCTGGACGGC TACGACCTGG TCAGCGCCGG CCCCCGGTTC 
GTCTGCGACG GGATCGCCGA GCAGGCGCTG CACGCCTCGT TCCTGGCGAC GCTGGTCTAC 
CGGTCCGGCC CGATCGGGCC GTCCTCCGTC CCCGCTCCGC ACCGTGTCGT GGCCAACGGC 
CAGTGCATGG CCTTCCGCCG TACGGCGATG CTGGCCGCCG GCGGGTTCGC GCGGGTCCGC 
GGGCACATGA CCGACGACGT GGCGCTGGCC CGGACCCTGG CCGCCGACGG CTGGGCGGTG 
GGCTTCCTGG ACGCGGGCGG CCTGCTGGAG GTCGACATGC ACGAGTCGGT GGCCGAGGTG 
TGGCGGGAGT GGGGGAGGTC GCTGCCGCTG CGCGACGTCA CCGGACCCGG CCGGCAGGCC 
GCCGACCTGG CCGCGATCTG GCTCACCGCC GCCCTGCCCG TGCTGCGGCT GGCGGCGGGG 
CGGCCCACCC GGCTCGACCT GGGGCTGCTG GCCGTACGCC TGCTGCTGAC CGGCGCGCTG 
CGCGGCAGCT ACGCCCGGCC CGGCCCCGGC GTGCTGCTGT CGCCCCTGCT GGATCCGCTG 
ACCGCGGTAC GGCTGACGCA GGCGACGCTG TGCCCGGTGC GCAGCTGGCG GGGCCGTACC 
TATTCCGGGA TCACGGCTCC GGGGGTCACG CCCGGCGCCC GGCCCGATCG GCCGGGCCGG 
GCCGGGCGGC CCGCGCCGCC TGCCCGAAGC GCAGCCCGAT GA

Protein sequence

MRPLTTLRTT AHRPGLLAAL HRVREIAPMS PLTVFQAAAA LAVGVRLARG RDRLPPLAPT 
GATAGRISVV IPARDEEGRI GPCLSAVLTD PAVAEVLVVD DESSDGTARL AADLGAKVVV 
GAPLPEGWVG KQWALLQGVE AAGGDIVVTL DADTRPAPGL FGALAAALDG YDLVSAGPRF 
VCDGIAEQAL HASFLATLVY RSGPIGPSSV PAPHRVVANG QCMAFRRTAM LAAGGFARVR 
GHMTDDVALA RTLAADGWAV GFLDAGGLLE VDMHESVAEV WREWGRSLPL RDVTGPGRQA 
ADLAAIWLTA ALPVLRLAAG RPTRLDLGLL AVRLLLTGAL RGSYARPGPG VLLSPLLDPL 
TAVRLTQATL CPVRSWRGRT YSGITAPGVT PGARPDRPGR AGRPAPPARS AAR