Gene Sros_3653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_3653
Symbol
ID	8666941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	4048685
End bp	4049908
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	64%
IMG OID
Product	hypothetical protein
Protein accession	YP_003339325
Protein GI	271965129
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTATC CCCCGCAGGG TCGGCAGCCG CATGGTCAGC GCCCGTGGCA GCCCTACAAC 
AGCCAACCGT CCCAGCACGG CCCCTACCCT TCCCAGGGCT ACCCGCAGCA GCCGACGGCA 
TACAGGCAGG TACAGCCGCG GCTGTATGCG ACTAACGGCT ATCCGATGCA ACAACCGGTG 
CCGCAATCAC AGCAGCGGCG TGGCGGGTCG GCCCTCTCCG TGGCGACTGT CGCGCTGGCC 
GTCATCGCGC TGCTCGGTGT TGCCGTCGTC ACGACCCTCC TCGTACTCAA CTCCGCCACC 
TCGACCGGAT CATCCGAGGG AGCGAGAGTG GCCCTGGTGG ACCTGCGGGC GCAGGAGCAG 
ACCGAGCCCG GGGTACGCAC TGCCGCGCAA CAGGCGTTCG ATCTGTACTC GGCCGGCTCC 
TATGGCGAGT TCTGGGATCG CTGGTCTGCG CAGTCGCAGT CCCTGATGCC GCGCGACGAC 
TACATCAGCA TGTTCGAACA GTGCCCGCAG GCCGCGCAGA ATCTGCGGTT CACAATCAGC 
TCAGTCGCTG TCAACGGCAC CGGCGCGAAG GTGAACGCCA ACCGTTTGAT CGCAGCGTTC 
ACCTTCGACT TCACCTATGA AGGCCAGGCG TGGCGGTATG TCCTACCTGC CGATCAGCAG 
CAGGAGTACC GCACCAAGAG CCTCGATCAG ATCGTGCAGG AGCGGCGGGC CTCCAAGGTC 
TGCGGTGGAC AGGATGGCGG CTTACGGCTC ACCCCCGTGC CGACTCAGCC CCTGATCGCA 
CAGCCGCCGA CAGCGCAAGC GCAGACAGTG ACGGTGGCGA AGGTCGGCGA GACCATCACC 
GTTAAGGGGC TACAGCCCGG CGTTGAAGTC GCTGTCACCC CCAATCGGGT CATTGACAAC 
GCGACCTCCG GCAACCAGTT CCTGAAGCCG AAAGACGGCA ACCGCTACAT CGCTGTCGAA 
CTCACCTTGA AGAATGTCGG CCAGGAGATC TACACCGACT CACCGGCTGT CGGCGGGACG 
TTGATCGACG CCGAAGGGCA ACAGCATCGG CCAACGTTCG CGGAAGTGAC GGAGGGAGCC 
GCGTTCGGCG GATCGGTCAC TGTGAACCGC GGCGATACCC GAAAAGGCCT GATCGTATTC 
GAAGTTCCCG CCTCGGCGAC GCCTGCCAAA CTGCAGTTCG GGGTCATGTT TGGTCAGCAG 
AAGGGCGAAT GGGCGCTGTC TTAG

Protein sequence

MTYPPQGRQP HGQRPWQPYN SQPSQHGPYP SQGYPQQPTA YRQVQPRLYA TNGYPMQQPV 
PQSQQRRGGS ALSVATVALA VIALLGVAVV TTLLVLNSAT STGSSEGARV ALVDLRAQEQ 
TEPGVRTAAQ QAFDLYSAGS YGEFWDRWSA QSQSLMPRDD YISMFEQCPQ AAQNLRFTIS 
SVAVNGTGAK VNANRLIAAF TFDFTYEGQA WRYVLPADQQ QEYRTKSLDQ IVQERRASKV 
CGGQDGGLRL TPVPTQPLIA QPPTAQAQTV TVAKVGETIT VKGLQPGVEV AVTPNRVIDN 
ATSGNQFLKP KDGNRYIAVE LTLKNVGQEI YTDSPAVGGT LIDAEGQQHR PTFAEVTEGA 
AFGGSVTVNR GDTRKGLIVF EVPASATPAK LQFGVMFGQQ KGEWALS