Gene Sros_0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_0407
Symbol
ID	8663675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	406495
End bp	407646
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	72%
IMG OID
Product	transcription termination factor Rho
Protein accession	YP_003336179
Protein GI	271961983
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG AAACCACCAC CAAGAAGCGG CCACGTGCCG CACGCCCTCC GCGTCCTCGC 
GAGAGCGACG CCTACCTGGA GACCGTGGCC GGGCTGCTCG ACGTCCGCGA CAAGACGGGC 
TACATACGCA CCCACGGCTA CCTCCCCGGG GTGGACGACG TGCGCGTGCC CCACGCCCAG 
ATCAGGCAGT ACGGCCTGCG TCCCGGCGAC CACGTCGTCG CCACCACGCG CAAGCCGTAC 
GAGAGGCTGG CCGAGGTGGA GAGCGTCAAC GGCTCCACCG ACTGGCGGAA CAGGCCCGAC 
TTCGCCGACA TGACGCCGAT CCACCCGCGC GAGCGGCTCC GTCTGGAGAC CGAGTCGGTG 
ACCAGCAGGG TCATCGACCT GTTCGCGCCG ATCGGCAAGG GCCAGCGCGG CCTGATCGTC 
GCCCCGCCGA AGGCGGGCAA GACCATGGTC CTGCAGGACC TGGCCGCCGC GATCACGCGC 
AACCATCCGG ACTGTCACCT CATGGTCGTG CTCGTCGGCG AGCGCCCCGA GGAGGTCACC 
GAGATGCGCG AGTCCATCCA CGGCGAGGTC GCCGCGTCCA CATTCGACCG CCCCGACCGC 
GACCACACCG CCCTCGCCGA ACTCGCCGTC GAGCGCGCCA AGCGCCTCGC CGAGAGCGGG 
CACGACGTCG TCGTCCTGCT CGACTCCCTG ACCCGCCTGG GCCGCGCCTA CAACAACCTC 
GCCCCCGGCG GCGGACGCAC CCTCGCCGGC GGCCTCGACG CCGCGGCCCT GCTCCCCCCG 
CGCCGCTTCT TCGGCGCCGC GCGCAACCTG CGTGACGGCG GCTCGCTGAC GATCCTCGCC 
ACCGCCCTGG TCGAGACCGG CTCGCGGATG GACGACAACC TCTTCGAGGA GTTCAAGGGC 
ACCGGCAACA TGGAGCTGCG CCTCAGCCGC GCGCTGGCCG ACAAGCGCCT CTACCCCGCC 
GTCGACCTCG ACGCCTCCGG CACCCGCCGC GAGGAGATCC TGCTCGACCC GCAGGAGCAC 
CAGCTCACCT GGCGCCTGCG CCGTACCCTC GGCGGCCTGG AGAAGCAGCA GGCCCTGGAA 
CTGCTCACCG ACAGGCTCCG GGAGACCCCT TCCAACGCCG CCTTCCTCCA GCAGGTCCGG 
CAGACCACCT GA

Protein sequence

MTIETTTKKR PRAARPPRPR ESDAYLETVA GLLDVRDKTG YIRTHGYLPG VDDVRVPHAQ 
IRQYGLRPGD HVVATTRKPY ERLAEVESVN GSTDWRNRPD FADMTPIHPR ERLRLETESV 
TSRVIDLFAP IGKGQRGLIV APPKAGKTMV LQDLAAAITR NHPDCHLMVV LVGERPEEVT 
EMRESIHGEV AASTFDRPDR DHTALAELAV ERAKRLAESG HDVVVLLDSL TRLGRAYNNL 
APGGGRTLAG GLDAAALLPP RRFFGAARNL RDGGSLTILA TALVETGSRM DDNLFEEFKG 
TGNMELRLSR ALADKRLYPA VDLDASGTRR EEILLDPQEH QLTWRLRRTL GGLEKQQALE 
LLTDRLRETP SNAAFLQQVR QTT