Gene Sros_4373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_4373
Symbol
ID	8667667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4880364
End bp	4881638
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	67%
IMG OID
Product	sodium:dicarboxylate symporter
Protein accession	YP_003339999
Protein GI	271965803
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATC TGATGAGCCG ACTGATCGTC GGCGCCCTTG TCCTGGGGGT CGGAGCGGGA 
CTGGTCTTGC ACTACCAGTT CGCCTCAAGC CGCGAGGAGA TCGTCGCGGT CCTGGAGACG 
GTGACGCACC TCTTCCTCAA TCTGATCAAG ATGGTGATCG CCCCGCTCAT CTTCGCGACG 
ATCGTCGGTG GCATCACCGG CATGGCGAAG GCCACGGGCA TCGGGTCGCT GTTCGCCCGC 
TCGATGGTGT GGTTCGTCTC CGCGTCGCTT CTCATCGGCG CCTACGGATT TCTCGCGGCG 
CACGCCATGG GCGTGGGGGA CGGGCTGAAC CTGACCCCGG CGGCAGGCGG GGCCGGCATC 
GAGACCGAGC CGGTCACGCC GGCCACGTTC GTCGAGGGAC TTGTCCCGCA GAGCTTCATC 
GAGGCGTTGG CCTCCAACAA GCCGATCCAG ATCCTTGTGT TCTCAATGTT CTTCGGGGTC 
GCCTTGCTCG CCCTCAAGTC CGCCAACGGC GACTCCCGTC TGGCCGACGC GATCGACGAG 
CTCACCAACG TAATGCTCAA GGTCACCGGA TACGTGATGG CGCTCGCACC CATCGGCGTC 
TTCACCGCCG TCGCCGCGGC ACTCACCGCG GAGGGTGTCG GCGCCTTCGC CACGTACGGG 
TCGCTGATCG TCAGTTTCTA CACCGCACTG GCAGGCCTGT GGGCCGCCCT GATCGCCGTG 
GGGGCCCTGT TCCTCGGCCG CGGAGTGCTC CGGCTGCTCG CCGCGGTGCG CGAGCCCATG 
TTCATCGCGT TCTCGACATC GAGCACGGAG GCCGCGTTCC CCAAGATGAT CAGCTCGCTG 
ACGTCCTACG GTGTCGATCG GCGGACGACC GGCCTGATCC TTCCGCTGGG CTACGCGTTC 
AACATCGACG GCTCGATGAT GTACATGATG TTCTCGTCGG TGTTCCTGGT CAACGCCTAC 
GACATCGACA TGCCCCTCGC CCAGCAGATC CTGATGTGCC TCGTCCTGCT GGTGAGCAGC 
AAGGGCATGG CCGGCGTGCC GCGCGGCGCG CTCGTGATCA TCGCCGCGGT CGTTCCCGGC 
TTCGGTGTCC CGGCGGCCGG CGTCGCGCTG CTGCTGGTGA TCGACCAACT GCTCGACATG 
GGCCGGACCG CGACGAACAT CCTCGGCAAC GCCGTCGCCG TCGCCGTCCT CGGCCGCGGC 
ACGACCGGCA CCACGACCCA CGGAACAACA CGAGCCGGCG ACGTTCCCGC GGCGGCCACC 
GAACCGGTGC GCTGA

Protein sequence

MKNLMSRLIV GALVLGVGAG LVLHYQFASS REEIVAVLET VTHLFLNLIK MVIAPLIFAT 
IVGGITGMAK ATGIGSLFAR SMVWFVSASL LIGAYGFLAA HAMGVGDGLN LTPAAGGAGI 
ETEPVTPATF VEGLVPQSFI EALASNKPIQ ILVFSMFFGV ALLALKSANG DSRLADAIDE 
LTNVMLKVTG YVMALAPIGV FTAVAAALTA EGVGAFATYG SLIVSFYTAL AGLWAALIAV 
GALFLGRGVL RLLAAVREPM FIAFSTSSTE AAFPKMISSL TSYGVDRRTT GLILPLGYAF 
NIDGSMMYMM FSSVFLVNAY DIDMPLAQQI LMCLVLLVSS KGMAGVPRGA LVIIAAVVPG 
FGVPAAGVAL LLVIDQLLDM GRTATNILGN AVAVAVLGRG TTGTTTHGTT RAGDVPAAAT 
EPVR