Gene Sros_3971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3971
Symbol
ID	8667265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4425414
End bp	4427003
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	68%
IMG OID
Product	monocarboxylic acid permease
Protein accession	YP_003339624
Protein GI	271965428
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0691283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.470061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGAGC ACCTGACCGA GATCATTGTC TTCTCCACAC TGTTCCTGCT CGTCAGCGGC 
ATGGGCTTCG TGGCCGCGCG CTGGCGCCGG CCGGACAACC TGGCCACCTT GGACGAGTGG 
GGGCTGGGCG GCCGGAGTTT CGGTCCCTGG ATCACCTGGT TCCTCGTCGG CGGCGACCTC 
TACACCGCCT ACACCTTCGT GGCCGTGCCC GCCCTGCTCT GGAGCGCGGG CGCGATGGGC 
TTCTTCGCCG TGCCGTACAC GATCGTGGTC TATCCGATCG TGTTCCTGGT GCTGCTGCGA 
CTCTGGTCGG TCTCGCACGT GCACGGGTTC GTGACCCCGG CCGACTTCGT CCGGGCCCGG 
TTCGGCTCCC CCACGTTGGC GCTGCTGATC GCGATCACCG GCATCGTCGC GACGATGCCC 
TACATCGCGC TCCAGCTCGT CGGCATCGAG GCCGTACTGA AGTCGATGGG GGTGACCGGC 
CACCTGCCGA TCATCATCGC GTTCGCCATC CTGGCCGCCT ACACCTACCA GTCGGGCCTG 
CGCGCCCCGG CGCTGATCGC CTTCGTCAAG GACACGCTGA TCTACATCGT GATCCTGGTC 
GCGATCATCG TCATCCCGGC CAAGCTGGGA GGCTGGGGCA CGATCTTCGA CGACGCCCAG 
GCCAAGTTCG CCGCCACGCC CGCGCCGGGG GACGGCATCC TGCTCAACGC CGGCAACCAG 
CTCCAGTACG TCACGCTGGC CCTGGGATCG GCGCTCGCGC TGTTCCTCTA CCCGCACAGC 
ATCACCGGCG TGCTGGCCTC ACGCAACCGC GATGTGATCA AGCGGAACAT GTCCGCGCTC 
CCCGCCTACA GCCTGCTGCT CGGCCTGATC GCGTTGCTCG GCTACATGGC CATCTCGGCC 
GGGGTCAAGC CCATCGGCAC GGACAACAAC ACGATCGTGC CCCAGCTGTT CGACAAGATG 
TTCCCCGACT GGTTCACCGG CGTCGCCTAC GCCGCGATCG GCATCGGCGC GCTGGTCCCC 
GCGGCGATCA TGTCGATCGC CGCGGCGAAC CTGTTCACCC GCAACATCTA CAAGGAGTAT 
CTGAAGCCGG CCGCCAGCGA GGCCGACGAG GCCCGCGTCT CGAAGATCAC CTCACTGCTC 
GTCAAGATCG GCGCGGTGCT GTGCATCCTG TTCCTGGACA CCGGCTTCTC CATCGACCTC 
CAGCTCATCG GCGGCGTCAT CATCCTGCAG ACGCTCCCGT CGGTGGCGCT CGGCCTCTAC 
ACCCGCTGGT TCCACCGGAT CGGCCTCATC GCCGGATGGG CGGGAGGCAT GGCCGCCGGG 
ACGCTCCTGC TCTACAACAT CGGCAACCCG GCCACCGGCA AGCTGCACTT CGCCGGATCG 
GCGTTCCCCC TGGAGAAGCT GGGCCTGGAC ACCAAGATGA CCATCTACGC GGGCGTCCTC 
GCCCTGGCCG TCAACCTGAT CGTCGCCGCC GTCGCCACGC TCATCGCCCG CGGCGCCAAG 
GCGTCCGAGG GTGACGACGC CACCCGGCCC GACCACTACC TCGCCGACGA GGGCGACCCC 
CGCATCAAGG ACCTCGACCT CACCCACTGA

Protein sequence

MSEHLTEIIV FSTLFLLVSG MGFVAARWRR PDNLATLDEW GLGGRSFGPW ITWFLVGGDL 
YTAYTFVAVP ALLWSAGAMG FFAVPYTIVV YPIVFLVLLR LWSVSHVHGF VTPADFVRAR 
FGSPTLALLI AITGIVATMP YIALQLVGIE AVLKSMGVTG HLPIIIAFAI LAAYTYQSGL 
RAPALIAFVK DTLIYIVILV AIIVIPAKLG GWGTIFDDAQ AKFAATPAPG DGILLNAGNQ 
LQYVTLALGS ALALFLYPHS ITGVLASRNR DVIKRNMSAL PAYSLLLGLI ALLGYMAISA 
GVKPIGTDNN TIVPQLFDKM FPDWFTGVAY AAIGIGALVP AAIMSIAAAN LFTRNIYKEY 
LKPAASEADE ARVSKITSLL VKIGAVLCIL FLDTGFSIDL QLIGGVIILQ TLPSVALGLY 
TRWFHRIGLI AGWAGGMAAG TLLLYNIGNP ATGKLHFAGS AFPLEKLGLD TKMTIYAGVL 
ALAVNLIVAA VATLIARGAK ASEGDDATRP DHYLADEGDP RIKDLDLTH