Gene Sros_2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_2801
Symbol
ID	8666087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	3040836
End bp	3042266
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	68%
IMG OID
Product	amino acid permease
Protein accession	YP_003338502
Protein GI	271964306
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.764757
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGATT CCTTTGGCGA TCGTCCACGC GGACGCACCG CCGCCGAAGA AGGAGTGATC 
CGCGACGACG CGGCCGAGGC CATAGCGTCC GAACACGGCA AACTCGGCCT CCCCGCGGCG 
ACGTCACTCG TCGTCGGCAA CATCGTGGGC ACGGGGGTGT TCCTGCTGCC CGCCTCCCTC 
GCCGCCTACG GCACGGTCAG CATCCTGGCG ATGGCCCTGG TGTCGATCGG CGCCATCGCG 
CTCGCCGTCG TGTTCGGCAG GCTCGGCGCG CGGGTGCCCG CGGGCGGCGG GCCGTACGCC 
TACGCCAAGG ACGCCTTCGG CGAGTTCCCC GGCTTCTGGA ACGCCTGGTC GTTCTGGCTG 
ACCGCCTGGA TCGGCAACGC CGCGATCGCC GTCGTCTGGG TCAACTACGT CAACTACTTC 
CTGCACTGGG ACTCCGCCGT CGCCCAGACC GCCCTGGCCT TCGTCGCCCT GTGGATCCCC 
GCGCTGATCA ACCTGAGCGG CGTGCGGAAC ATCGGCGCCT TCACCCTCGT CACGACGGTG 
CTGAAGTTCA TCCCGCTGAT CTTCGTCGCG GTGGTCGGCC TGTTCTTCGT CCGGAGCGCC 
AACTTCGGCC CGTTCAACGC CACCGACGGC AACTGGATCG GCGCCGTGTC CACCGCCGGC 
GCGCTCGCGC TGTTCATCTA CTCCGGCGTC GAGAGCGTCA CCATCGTGGC GGAGAAGATC 
AAGAATCCGG CGCGCAACAT CGGCAGGGCC AGCGTGTACG GCGTGCTGAT CTGCGCCGCC 
ATGTACATGC TCAGCACCGT CGCCATCTTC GGCACCGTCC CGCACGACGC CCTCGTCAAC 
TCCCCCGCCC CGTTCGCCGA CGCGATCAAC AACATGTTCG GCGGCGGCAT CGGCGGCGGC 
ATCATGGCGG CCTGCGCGGT CGTCTCCGGA ATCGGCGCCA TCAACGGCTG GACCATGCTC 
GTGGCCGAGA TGCCGATGGC CGCGGCCAGG GACGGCCTGT TCCCGGAGAT CTTCACCAGG 
GAGAACCGCC GCGGCGCCCC GTGGGTGGGC ATCGTCCTGG GCACCGCGCT GACCTCGCTG 
GTCGCGGTCT ACAACTACTT CGGCACCACC GAGGGCTTCA ACAAGATCTT GCTGATCGCC 
ACCTTCACCA CGGTCATCCC CTACTTCTTC TCCGCGTGCG CCCAGCTGTT CTGGCTGGTC 
ACCGGGGCCA GAAAGGTCCG CGGAGCCCGC CTGGGCCGCG ACCTGACCAT CACCGCCGTG 
GCCATCCTGT TCGCCTTCTG GATGACCTAC GGCGCCGGCA TGGAGGCAGT CTTCATCGGC 
TTCCTGATGA TGCTCGTGGG CATCCCGGTC TACATCTGGA CCAAGGCGAA GCGTGGCGAG 
TACGGCACCA GGGAGGGAGC ACCGGCCTCA CCCCCCGGAC GATCTCGTTA A

Protein sequence

MGDSFGDRPR GRTAAEEGVI RDDAAEAIAS EHGKLGLPAA TSLVVGNIVG TGVFLLPASL 
AAYGTVSILA MALVSIGAIA LAVVFGRLGA RVPAGGGPYA YAKDAFGEFP GFWNAWSFWL 
TAWIGNAAIA VVWVNYVNYF LHWDSAVAQT ALAFVALWIP ALINLSGVRN IGAFTLVTTV 
LKFIPLIFVA VVGLFFVRSA NFGPFNATDG NWIGAVSTAG ALALFIYSGV ESVTIVAEKI 
KNPARNIGRA SVYGVLICAA MYMLSTVAIF GTVPHDALVN SPAPFADAIN NMFGGGIGGG 
IMAACAVVSG IGAINGWTML VAEMPMAAAR DGLFPEIFTR ENRRGAPWVG IVLGTALTSL 
VAVYNYFGTT EGFNKILLIA TFTTVIPYFF SACAQLFWLV TGARKVRGAR LGRDLTITAV 
AILFAFWMTY GAGMEAVFIG FLMMLVGIPV YIWTKAKRGE YGTREGAPAS PPGRSR