Gene Sros_6471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sros_6471
Symbol
ID	8669780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptosporangium roseum DSM 43021
Kingdom	Bacteria
Replicon accession	NC_013595
Strand	-
Start bp	7090050
End bp	7091207
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	72%
IMG OID
Product	VWA containing CoxE family protein
Protein accession	YP_003341928
Protein GI	271967732
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0451364
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.124275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAGA GACTGCGCCG CTGGCGGCTG GTGCTCGGCG GCGACGCCGA CGGCACGGGA 
TGCGCCCTCG GCGGGACCGA CGCCCAGATG GACGGAGCCC TGGCCGCGCT CTACAACGGC 
GGTAAGGGCG AGGGCGCGGA CGAGCGGAGC GGCGGCCTGG GCGCCTCCGC GCCCAGGGTG 
GCGCGCTGGC TGGGCGACAT CCGGTCCTAC TTCCCCTCCA CCGTCGTCCA GGTCATGCAG 
AAGGACGCCG TCGAGCGGCT GAACCTGACC AGGCTGCTGC TGGAGCCGGA GATGCTGGAG 
GCGGTCGAGC CCGACGTCCA CATGGTCGGC ACGCTGCTGT CGCTCAACCG GGTGATGCCG 
GAGAAGGCCC GCGAGTCGGC CCGCGCGCTG GTCCGCAAGG TCGTCTCCGA GCTGGAGCGG 
CGGCTGGTGC AGAAGACGAA GGCGGCCGTC ACCGGCGCGC TGGACCGGTC GGCGCGCACC 
CACCGGCCCA AGCGGGTCGC CGACATCGAC TGGGACCGCA CGATCCGGGC CAACCTGAAG 
AACTACCTGC CCGAGCGGAA CACCGTGGTG CCGTCGAGGC TGGTCGGCTA CGGCAGGCGG 
CAGCGGGCCG TCCAGCGCGA GGTCGTGCTC TGCATCGACC AGAGCGGGTC GATGGCCGCC 
TCCGTCGTCT ATTCGAGCGT CTTCGGCGCG GTGCTCGCCT CGATGCGCTC GCTCAGGACG 
TCGCTGGTGG TCTTCGACAC CGCGGTCGTC GACCTCACCG ACCAGCTCCA CGACCCGGTG 
GAGCTGCTGT TCGGCACCCA GCTCGGCGGC GGCACCGACA TCAACCGGGC CATCGCCTAC 
AGCCAGGGCC TCATCACCCG GCCCACCGAC TCGATCTTCA TCCTGATCAG CGATCTCTAC 
GAGGGCGGGG TCCGGCAGGA GATGCTCCGC AGGGTCGCCC AGATGACCGC GGCCGGAGTC 
CAGGTCATCG TGCTGCTCGC GCTCTCGGAC GAGGGAGCTC CCTTCTACGA CCGCGACAAC 
GCCGCCGCCC TGGCGGCCCT GGGGGTGCCC GCGTTCGCGT GCACCCCCGA CGCCTTCCCC 
GCCCTGATGG CCGCGGCGAT CGAGCGCCGC GACATCGGCC AGTGGGCCGA GCGGGAGCTG 
GAACGCACGG CCACATGA

Protein sequence

MDERLRRWRL VLGGDADGTG CALGGTDAQM DGALAALYNG GKGEGADERS GGLGASAPRV 
ARWLGDIRSY FPSTVVQVMQ KDAVERLNLT RLLLEPEMLE AVEPDVHMVG TLLSLNRVMP 
EKARESARAL VRKVVSELER RLVQKTKAAV TGALDRSART HRPKRVADID WDRTIRANLK 
NYLPERNTVV PSRLVGYGRR QRAVQREVVL CIDQSGSMAA SVVYSSVFGA VLASMRSLRT 
SLVVFDTAVV DLTDQLHDPV ELLFGTQLGG GTDINRAIAY SQGLITRPTD SIFILISDLY 
EGGVRQEMLR RVAQMTAAGV QVIVLLALSD EGAPFYDRDN AAALAALGVP AFACTPDAFP 
ALMAAAIERR DIGQWAEREL ERTAT