Gene Sros_6607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6607
Symbol
ID	8669916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	7273856
End bp	7275490
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	75%
IMG OID
Product	carbon-nitrogen family hydrolase
Protein accession	YP_003342062
Protein GI	271967866
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.228741
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.120633
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGCG TCGCCGCGGT GCAGTTCGCA ACCGGCCTGG ATGTGACCGC CAACCTCGCG 
ACCTGCCTGC GAATGATCGA CTCCGCCGCC GGGCAGGGGG CCGAGCTGAT CGTGCTGCCC 
GAGTTCTGCA ACCACCTGTC CTGGTACGAG AGCCGCGACC ACGCGCGCCG CCTGGCCTGC 
CGCCACGGAG ACCCGTTCCT GAGCGCCGTC GCCGGGCGCG CCGCCCGGCA CCGCGCGCAC 
GTCAAGCTCG GCGTCACCCT GGCCCGCGAG GACGGCCGCG TCACGGGGGC CTCCCTGCTG 
TACGGACCGG ACGGCGCGCT GCTAGGCGAG GCCGACAAGC AGGTGCTGAT GGGCGCGGAG 
AACGACCACC TGGACCCGGG AACGGCCGTC GGCCCGGTGG TGGCGACCGC GGTCGGCCGG 
CTCGGCATGT ACGCCTGCAT GGAGGGCGTG ATCAGCGAGA TCACCCGCGG GCTGGCGCTG 
CGCGGCGCGC AGGTCCTGCT CAACAGCCTG AACTCCTTCG CCGTGGACGA GGCGAGCCTG 
CACGTGCCGG TCCGCGCCGC GGAGAACAGG GTGTGGGTGG TCGCCGCCAA CAAGGTCGGG 
CCGCTGCTGC CCGCCGACAG GATCGAGCTG ATCGGCGCCG GGCTCGGCGT CCCGCCCGAG 
TGGCTGCACG GCGCGGGTGA GAGCCAGGTC GTCGCCCCCG ACGGCACCGT CGTGGCCAGA 
GCGCCAAGGA CCGGCGAGGC TGTCGTGGTG GCCGACGTCG ACGTGGCCCT GGCCGACGAC 
AAGGTCCGGC CCGACGGCAC GGACGTGCTG GCCGCCCGCC GCCCCGCCCT CTACCGGCCG 
ATCGCCGCCG AACCCCGCGG CCGTACGGCT CCCGCCGGAG CGGGCAGCGT GGCCGTGGCC 
GTGGTCAGGC CGTGCGCGGG GCTCGGAGGC GCGACGGAGC TCATCAGGCG GGCGGCCGAG 
AGCGGGGCGG AGCTGCTCGT GCTGCCCGAG CTGTGCGGGG TGACGGCCGA GGAGGCGGCG 
CGGGCCGTAC GCGGGACCAC CGCGCACGTG GTGCTCAGCG AGATCCGCGA CCGGGCGCAC 
GACGGGCTGC TGGTCTCGGC CGACGGGATC ATGGGACGGC AGCGCAAGCT CCACCCGTCC 
GCGCGGCAGG CCGGGCGGGT CACCGCGTTC GGGGACGGGC TGGAGGTCTT CGAGCTGCCG 
TGGGGAAGGC TGGCCATCAT CGTCGGCGAT GACACGATAT TTCCGGAAAC GTTCAGGCTG 
GCGGCGCTGG CCGACGCCGA CGTCGTCGCG GCGCCCCTCA CCCCGTCCGA GCCCTGGGAA 
CTCCGGTCCG GCCTGCTGGA ACGGGCCGCG GAGAACCGGC TCAACGTCGT CGCCGCCGGA 
CACGACGGGC CCGGCGGCCT CGCCGGCGCC ATCCTGGCCG CGCCGCGGGA CTTCACGCTC 
TGGACCGCCT GGGAAGGCCC GTTCACCGGC CGCATCAGCC ACCCGATCGT CACCCCGGTC 
AGGAACGACG ACCGCGTGGT GCGCGCCGAC GTCCACCCTG CGCAGGCCGT CAACCGGCAC 
GTCTCACGCG GCACCGACCT GGTGGACGGC AGACCGTGGC GGCTCGTCGG CGCGCTCCTG 
GAAGGAGACA CGTGA

Protein sequence

MVRVAAVQFA TGLDVTANLA TCLRMIDSAA GQGAELIVLP EFCNHLSWYE SRDHARRLAC 
RHGDPFLSAV AGRAARHRAH VKLGVTLARE DGRVTGASLL YGPDGALLGE ADKQVLMGAE 
NDHLDPGTAV GPVVATAVGR LGMYACMEGV ISEITRGLAL RGAQVLLNSL NSFAVDEASL 
HVPVRAAENR VWVVAANKVG PLLPADRIEL IGAGLGVPPE WLHGAGESQV VAPDGTVVAR 
APRTGEAVVV ADVDVALADD KVRPDGTDVL AARRPALYRP IAAEPRGRTA PAGAGSVAVA 
VVRPCAGLGG ATELIRRAAE SGAELLVLPE LCGVTAEEAA RAVRGTTAHV VLSEIRDRAH 
DGLLVSADGI MGRQRKLHPS ARQAGRVTAF GDGLEVFELP WGRLAIIVGD DTIFPETFRL 
AALADADVVA APLTPSEPWE LRSGLLERAA ENRLNVVAAG HDGPGGLAGA ILAAPRDFTL 
WTAWEGPFTG RISHPIVTPV RNDDRVVRAD VHPAQAVNRH VSRGTDLVDG RPWRLVGALL 
EGDT