Gene Sros_9064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_9064
Symbol
ID	8672410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	10003973
End bp	10005268
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003344433
Protein GI	271970237
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGGGA CCGCCCAAGT CACCTCCTTC GAGGTGTTCG AGCGCGTCGC CCAAGGCCTG 
CGCATGCCCG ACCCCGCCCG CATGGCCCTG GGCCTGGCCC CTACCCGGCC GGCGGCACCA 
CGAGTGATCG ACGCCGTTAC CCATCCCGCC TCAGTCATCC CGTCTCGGGA TGGAACGCCA 
ACAAGTGCCC TGCTTAGCGT GGAGAGCGCT GTTGCCGTTG GCCAGCCTCC GAGGGACGTC 
GACGTTCTGA CCCTGGCCTG GATTGTGGGA AGGCTGGACT CTCACATGGA CCGCCGAACG 
ATGCTCATCC TCGCCGCCGG AATGACCGCC GAAACCGCGG CCACCATCGC CGACCCCTGG 
GAGCGCCTGT CCCGCGCGCT GACCGGACCA CAGACACTCG ACGAAGACAC CATCGAACGC 
CTCGAAGCCC GCACCATCGG CTTCCACCGC CTGGAGTACG TGCTCCCCGC CCGAGCCATC 
TACCAAGGGC TCACCACCCA CATCAACGAA CTGAGCAACC TGCTCCAGAG CGGCCCGCCC 
GACCGCTTCC GCCGACGCCT GGCCGCGACC GCCGGCGAAG CCGCCACCCT CGCCTCCTGG 
ATCGCCTGGG ACCTCAAGCA GCCCGGCCAG TCCGCCTCAT TCGAGCGCGT CTCCGCCCTG 
GCCGCCAAGG AGAGCGGGCA CCCGATCATC CAGGCGTGCA CCTACGCCTA CAGGTCCAAT 
GCCGCCGAAG GCCACACCGC CTACGAGGCC GTACGGCAGG CACAGCAGTT CCTCCCCGCC 
CAGGGCGACG ACGCCACCCG GGCATGGCTG CTCAGCAGGG AAGCCGAAGA GTTGGCTGCC 
CTCGGTGACC GCCGCGCCGT CGACCTGTTG CACCAGGCCG AAGAGGCCTA CGGTCGAGCA 
CGACCCCACC GCGAACGCGC CTGGACCCGC TTCCTCGACC CCGGCCGCAT GGCCGCCTTT 
CAACTGTCCA CCTACGTACG ACTCGGCGAC GAACGTCAGG TGATCGAGGC CGGCCAGGCC 
GCGCTGTCGG CCGTCGCCCA GGACGCCGAC CACAAGAAAG TGGCCGTCAT CTACGCCGAC 
ATCGCCCAGG CCCAGCTCCA GATAGGCGAC GTTGCCGAAG GAATCGCCTA CGCCCGTCGG 
GCGCTCGACG CCGCCCAGCG CGGCGAATCG ACCTGGGGAC TCCAGCACCT CACGACGGTG 
GAGAAGGCCC TTTCCACCCA GCAGGACCAG GCCGCCCGGG ACCTGCTCGG CGACATCGTC 
TCTACGCGCC GGACACTCGG GCCGTCTCCC GCCTGA

Protein sequence

MKGTAQVTSF EVFERVAQGL RMPDPARMAL GLAPTRPAAP RVIDAVTHPA SVIPSRDGTP 
TSALLSVESA VAVGQPPRDV DVLTLAWIVG RLDSHMDRRT MLILAAGMTA ETAATIADPW 
ERLSRALTGP QTLDEDTIER LEARTIGFHR LEYVLPARAI YQGLTTHINE LSNLLQSGPP 
DRFRRRLAAT AGEAATLASW IAWDLKQPGQ SASFERVSAL AAKESGHPII QACTYAYRSN 
AAEGHTAYEA VRQAQQFLPA QGDDATRAWL LSREAEELAA LGDRRAVDLL HQAEEAYGRA 
RPHRERAWTR FLDPGRMAAF QLSTYVRLGD ERQVIEAGQA ALSAVAQDAD HKKVAVIYAD 
IAQAQLQIGD VAEGIAYARR ALDAAQRGES TWGLQHLTTV EKALSTQQDQ AARDLLGDIV 
STRRTLGPSP A