Gene Sros_8848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_8848
Symbol
ID	8672186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	+
Start bp	9768859
End bp	9770067
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_003344224
Protein GI	271970028
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCACG CCGCGGGATG TCTCCCGATC GTCCTCCTCC CCCTCGCCAT CACGGGCTGC 
TCGTCGGTCG TGGCCGGAGG CGACCATCCG GCGGCGGCGC CGAGAGTGAA GATCTCCCCG 
TCCCCGGACT CCGTGCGGGC CGGCACCGGC CGGGGCCTGG TCGTCCGGGC CGCCACGGGC 
ACGCTGACCG GGGTGACCGC CTACGGGGGC GGCGCCCCGG TGCCGGGCCG GTTCGACGGC 
ACCCGTTCCA CCTGGCGCTC GGACTGGACC CTGACCCCCG ACCGGGAGTA CATCGTCAAG 
GTCACCGCGG CGGGCGGGGA CGGCGCCACG ACGACCACCT ACGGCAGGTT CCGCACGCTC 
GCACCCTCCC GGACCTTCCA GGTCGCCTCC GTCGTCCCCG CGCCGGGCGA GACCGTGGGC 
GTCGGCATGC CGATCATCGT GGACTTCACC GTCCCGGTGG AGGACAGGGC GGCCGTCGAG 
AAGGCCCTGG AGGTCCGCTC CACCAAACCT GTCGAGGGCG CCTGGCACTG GGTGAGCGAC 
ACCGAGGTGG TCTACCGCCC CCGCCGTGAC TGGCCGGCCC GGCAGCGGGT CTCCTTCACC 
GCGCACCTGT CCGGGGTCCG CGCGTCCAGG GACACCTACG GCACGGCCGA CCACACGGTG 
CCCTTCGCCA TCGGCCGGGG GCAGGTCAGC TTCATCGACA CCCGGACCCA CCAGATGCGG 
GTCATGCGGG ACGGCAGGAC GGTCCAGCGG ATGGCCATCA GCGCCGGCAT GGCCACCACC 
GAGGAATACA CCACGACGAG CGGCATCCAC CTGACCATGG ACAAGGCCGA CCCGGTCCGC 
ATGGTCTCCC CCGGCCGCAA GAAGGGCGAC CCCGGCTTCT ACGACGTCAT GATCGACCAC 
GCGGTCCGGA TCTCCAACAG CGGCGAATAC GTCCATGCCA AGGACAACGT GTGGGCGCAG 
GGCAGGCAGA ACGTCAGCCA CGGCTGCGTC AACGCCCGGC CCGACCAGGC CGCCTGGTTC 
TTCGACAGCT CCCTGCGCGG CGACCCGGTC GTCATCCAGG GCACCGACCG CGAGCTCCGC 
TGGGACAACG GCTGGGGTTA CTGGCAGCGT TCCTGGGAGG AGTGGCTCGG CGGCAGCGCC 
CTGCGCGCCG CCGAGCCGCC GCAGCTCCTG ATGACCCCTG ACACTCCGCC AGATAACGAC 
ATACGGTAG

Protein sequence

MRHAAGCLPI VLLPLAITGC SSVVAGGDHP AAAPRVKISP SPDSVRAGTG RGLVVRAATG 
TLTGVTAYGG GAPVPGRFDG TRSTWRSDWT LTPDREYIVK VTAAGGDGAT TTTYGRFRTL 
APSRTFQVAS VVPAPGETVG VGMPIIVDFT VPVEDRAAVE KALEVRSTKP VEGAWHWVSD 
TEVVYRPRRD WPARQRVSFT AHLSGVRASR DTYGTADHTV PFAIGRGQVS FIDTRTHQMR 
VMRDGRTVQR MAISAGMATT EEYTTTSGIH LTMDKADPVR MVSPGRKKGD PGFYDVMIDH 
AVRISNSGEY VHAKDNVWAQ GRQNVSHGCV NARPDQAAWF FDSSLRGDPV VIQGTDRELR 
WDNGWGYWQR SWEEWLGGSA LRAAEPPQLL MTPDTPPDND IR