Gene Sros_5040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_5040
Symbol
ID	8668334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	5562472
End bp	5563890
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	70%
IMG OID
Product	Amino acid transporter-like protein
Protein accession	YP_003340574
Protein GI	271966378
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.973812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0393734
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAC CTCCTACCCG CATCGAAAAA CCCCCGCAGC ACTTTCACCG CGTGATGACC 
TGGCGGGACG CGTTCTCGCT GGCGATCACG CTGCCCGCCA GCGCCTTCGC ACTGGTCGGC 
TACTGGACCG GCGCACTCGG CGCGTGGGCG GCCGTCACGC TGCTCGCCGT ATCGGGGCTG 
CTCGCGATCT GCCAGAACTT CGTGTACGCC GAGATGGCGG CCATGTTCCC GGACAAGCCC 
GGAGGCATCG CACTGTACGC CTCGGCCGCC TGGGGCGGTC GCAGCCGTCC GCTCGGCGCT 
CTCGCTTCGG CGGGTTACTG GATCGGATGG TCATTCGGCC TGGCCGGGAA CGCGCTCGTG 
GTCGGTGAGC TGATCGAGGC GCAGTGGTTC CCCCGGGCCG GGACGCTGGA GGTCGGCCCG 
CTGCACCTGG GCGGCGCACA CGCCGTCGCG GTGGCCGCGC TGGTGCTGGT GTGGCTGCTC 
AACACGGCCG GGATCCGGCC CGCGGTCCGG CTGAGCACGA TCGTCAACAC CCTGGTGCTG 
GTGGTGCTCG CGGTGGCCGC CGCGACGGCG CTCCTCACCG GGAACCTGCA CCTGGACCGG 
CTGACCTGGG GCCTCGGCGG CGACGGCCAG TCGCCGTTCG TGGTCGCGTG CGTGTGGCTG 
TTCCTCATGG GCTGGACCGT CTACGGCACC GAGATCGCCG CCACGTTCAC CCCGGAGTAC 
CGCAACCCGC GCTCGGACGC TCCCCGGGCG CTCATCTCGT CGGGCATCGC CGCGCTGGCC 
GTGTTCGTGC TGATGCCGGT GCTCGCCGCG GGCACGACGG GCGAGGCAGC CATCACGGCC 
GAGCCTCTCG GGTTCACCGT CGTGATGTTC GAGAACCTGT TCGGCGGTGC CGGCTGGCTC 
GCCGTGGTGG TGCTGTGCCT GGCCATGCTC AACCTCATGT CGGTGGCGAC CGCTGACAGC 
GGACGGGCTC TGCACGGCAT GGCGGTCGAG GGACTGACCG TCCGCAGCCT CGGTGTCCTC 
AACTCCGCGG GCATGCCCGC CCGCGCCATG ACCGCCGGGC TGCTGGTCAA CGTCGGCCTG 
GTCGTGTTCA TCGGCAACCT GCTGGGCGTC GTGTTCGCCT CGAACATCGG CTACATGATC 
GCCGTCGTCG TCGCGCTCTG CGGCTACGTG CTGCTGCGGC GGGCGAACAC GACCCCTGAC 
CGGGCGTTCC GGCTGCACCG GTGCTGGGTG TCGATCGCCG CCGCTCTCGC CGGGATCAAC 
CTCCTGCTGC TGGTAGTCGC CGCATTCAAC CCGGAGCTGA CCGGCTACGG CAGCTGGCGC 
GACGAGCTGA TCGGGTTCGG CGTGCTGGCC CTGGCCATGA CCCTCTACGC CGCTCGCCGT 
CTCGGCGATC GGACCCCGAC CTACAAGAAC CCGAGGTAA

Protein sequence

MSEPPTRIEK PPQHFHRVMT WRDAFSLAIT LPASAFALVG YWTGALGAWA AVTLLAVSGL 
LAICQNFVYA EMAAMFPDKP GGIALYASAA WGGRSRPLGA LASAGYWIGW SFGLAGNALV 
VGELIEAQWF PRAGTLEVGP LHLGGAHAVA VAALVLVWLL NTAGIRPAVR LSTIVNTLVL 
VVLAVAAATA LLTGNLHLDR LTWGLGGDGQ SPFVVACVWL FLMGWTVYGT EIAATFTPEY 
RNPRSDAPRA LISSGIAALA VFVLMPVLAA GTTGEAAITA EPLGFTVVMF ENLFGGAGWL 
AVVVLCLAML NLMSVATADS GRALHGMAVE GLTVRSLGVL NSAGMPARAM TAGLLVNVGL 
VVFIGNLLGV VFASNIGYMI AVVVALCGYV LLRRANTTPD RAFRLHRCWV SIAAALAGIN 
LLLLVVAAFN PELTGYGSWR DELIGFGVLA LAMTLYAARR LGDRTPTYKN PR