Gene Sros_5114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5114
Symbol
ID	8668408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5627947
End bp	5629257
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	64%
IMG OID
Product	aminotransferase class-III
Protein accession	YP_003340640
Protein GI	271966444
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.128293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTAATG CGTCATTCTG GAATGATGTG GAATGTCACC TGATCCGATA CGGCGCGACG 
TTCACTCCAA GGATCATCGA ACGGGCCGCG GGGTCGTACG TGTATGACGA CGCCGGGACG 
GCGATCCTCG ACTTCACCTC GGGTCAGATG AGCTCGATCC TCGGGCACTC CCACCCCGAC 
GTGGTTGCGA CGGTCTCGCG GTCGATCTCA TCGCTGGATC ACCTGTACAG CGGCATGCTG 
AGCCGGCCCG TCGTCGACCT GGCCAACCGG CTCGCGTCAA CACTTCCCGG CGACTTGAGC 
AAGACGCTGC TGCTGAGCAC CGGCGCGGAG TCCAATGAGG CCGCGATCAA GATGGCCAAG 
CTCTACACAG GCAAGTATGA GATCGTCTCG TTCGACCGGT CGTGGCACGG TATGACGTCG 
GGTGCGTCCT CCGCCACCTT CTCGGCCGGC CGAAGAGGCT ACGGCCCGTC CATGCCGGGC 
AACCTCACGC TCCCGTCGCC GAACGCGTAT CGCTCTCCTT TCCGTCGTAC GGACGGGTCC 
TACGACTGGG AGGCCGAGCT TGAGTACGGG TTCGCTCTCG TCGACCAGCA GTCGTCCGGG 
AGTCTGGCCG CATGCATGGT CGAGCCGATC CTGTCCGCCG GTGGGATCAT CGAGCCTCCG 
GTCGGATATC TGCGGCGATT GAAAGCGATG TGCGCCGAAC GCGGGATGCT GATGATCGTG 
GACGAGGCCC AGACCGGACT CGGACGCACC GGCGAGATGT ACGCCTTCGA ACGCGACGGC 
ATCGTCCCGG ATCTCCTGAC GCTTTCCAAG ACCTTGGGTG CGGGCCTGCC GGTAGCGGCC 
GTCGTCACGT CGTCGCAGAT CGAGGAGGTC TGTCACGAAC GCGGGTTCCT GTTCTTCACG 
ACCCACGTCT CGGACCCACT GGCGGCATCC GTCGCGGTGA CTGTGCTCGA CGTCATCGAA 
CGCGACAGTC TCGCGGCGCG GACCGCGGTT CTGGGTAAGC AACTCAACGA GCGGTTGCTG 
GACCTGCGTG ACCGCTTCGA GGTGGCCGGC GATGTGCGCG GTCGCGGGCT TCTGCAGGGC 
CTGGAACTGG TGACGGACAA GCTGAGCAAG TCCCCCGCGG ACTCGCTCGC AAATGCCGTG 
ACCATGGCAT GTCTGGAGCG CGGGCTCCAC ATCAACATCG TTCAATTGCC AGGAATGGGA 
GGAATCTTCC GGATCGCACC GCCGCTCACG ATCAGCGACT CGGACTTGCA CGCCGGCCTG 
GACATCCTCG AGGCATCTCT GAGAGCGGTC GTCTCCGGGG GTGGAAAGTA A

Protein sequence

MSNASFWNDV ECHLIRYGAT FTPRIIERAA GSYVYDDAGT AILDFTSGQM SSILGHSHPD 
VVATVSRSIS SLDHLYSGML SRPVVDLANR LASTLPGDLS KTLLLSTGAE SNEAAIKMAK 
LYTGKYEIVS FDRSWHGMTS GASSATFSAG RRGYGPSMPG NLTLPSPNAY RSPFRRTDGS 
YDWEAELEYG FALVDQQSSG SLAACMVEPI LSAGGIIEPP VGYLRRLKAM CAERGMLMIV 
DEAQTGLGRT GEMYAFERDG IVPDLLTLSK TLGAGLPVAA VVTSSQIEEV CHERGFLFFT 
THVSDPLAAS VAVTVLDVIE RDSLAARTAV LGKQLNERLL DLRDRFEVAG DVRGRGLLQG 
LELVTDKLSK SPADSLANAV TMACLERGLH INIVQLPGMG GIFRIAPPLT ISDSDLHAGL 
DILEASLRAV VSGGGK