Gene Svir_21990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Svir_21990
Symbol
ID	8387523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharomonospora viridis DSM 43017
Kingdom	Bacteria
Replicon accession	NC_013159
Strand	-
Start bp	2367669
End bp	2369027
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	65%
IMG OID	644976252
Product	putative proteasome component/protein of unknown function, DUF275
Protein accession	YP_003134034
Protein GI	257056202
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0167932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGGC GGATCTTTGG GATCGAAACC GAGTTCGGGG TTACCTGCAC TTTCCACGGA 
CAGCGCAGGT TGTCACCCGA CGAAGTGGCG CGGTACCTGT TCCGGCGGGT GGTGTCATGG 
GGTCGGTCCT CGAACGTGTT CCTGTCCAAC GGTTCCCGGC TCTATCTGGA CGTGGGGTCG 
CATCCCGAGT ACGCGACCGC CGAATGTGAC GACCTTGCCC AGTTGGTGAC GCACGACAAG 
GCAGGGGAGC GGATCCTGGA GGATCTGCTG ATCGACGCGG AACGTCGGCT CGCCGAGGAG 
GGGATCGGCG GCGACATCTT CCTGTTCAAG AACAACACCG ACTCGGCGGG GAACTCGTAC 
GGGTGTCACG AGAACTACCT GGTGACGCGT GCGGGTGAGT TCTCGCGGGT GGCCGACGTG 
TTGCTGCCGT TTCTGGTGAC GCGGCAGCTG GTGTGCGGGG CGGGAAAGGT GCTGCAGACC 
CCCCGTGGTG GGGTGTATTG CCTGTCGCAG CGTGCCGAAC ACATCTGGGA GGGCGTGTCC 
AGCGCGACCA CGCGGTCACG GCCGATCATC AACACGCGGG ACGAACCGCA CGCCGACGCG 
GAACGCTACC GCCGGCTGCA TGTGATCGTC GGCGATTCGA ACATGGCGGA GCCGACGACC 
TTGCTGAAGG TCGGCTCGGT GCACCTGGTC CTGCAGATGA TCGAAGAGGG TGTGCAGTTC 
CGGGACTTCA CCCTGGACAA CCCCATCCGA GCGATCCGGG AGATCAGTCA CGACCTGACG 
GGGCGGCGTC AGGTTCGGCT GGCCGGTGGC CGGGAGGCCT CGGCCCTGGA GATCCAGCGG 
GAGTACTACG CGCGTGCGGT GCAGCACGTG GAGTCGGGCG ATCCGTCGCC GACCACGCAA 
TACCTGATCG ACCTTTGGGG ACGGGCACTG GATGCGGTGG AACAGCAGGA CTTCTCGAGT 
ATCGACACCG AGATCGATTG GGCGATCAAG CACCGCCTGG TGGAGCGTTA CCGCAGTAAG 
CACAACTTGA CGTTGTCGGA CCCGCGGGTG GCGCAGCTGG ACCTGGCCTA CCACGACATC 
CGGCGGGGGC GTGGGGTGTT CGATCTGCTG CAGCGCAAGG GCATGGTGCG GCGGATCACC 
GACGACGGGG AGATCGAGCT GGCCAAGGAC AGTCCACCTC AGACCACGCG GGCGAAGTTG 
CGAGGTGACT TCATCGCGGC GGCGCAGGAG GCGGGGCGGG ACTTCACGGT GGACTGGGTC 
CACCTGAAGC TGAACGACCA GGCGCAGCGA ACAGTGCTGT GCAAGGACCC GTTCCGGTCG 
GTGGACGAGC GGGTGGAGCG GTTGATCAAC TCGCTGTGA

Protein sequence

MQRRIFGIET EFGVTCTFHG QRRLSPDEVA RYLFRRVVSW GRSSNVFLSN GSRLYLDVGS 
HPEYATAECD DLAQLVTHDK AGERILEDLL IDAERRLAEE GIGGDIFLFK NNTDSAGNSY 
GCHENYLVTR AGEFSRVADV LLPFLVTRQL VCGAGKVLQT PRGGVYCLSQ RAEHIWEGVS 
SATTRSRPII NTRDEPHADA ERYRRLHVIV GDSNMAEPTT LLKVGSVHLV LQMIEEGVQF 
RDFTLDNPIR AIREISHDLT GRRQVRLAGG REASALEIQR EYYARAVQHV ESGDPSPTTQ 
YLIDLWGRAL DAVEQQDFSS IDTEIDWAIK HRLVERYRSK HNLTLSDPRV AQLDLAYHDI 
RRGRGVFDLL QRKGMVRRIT DDGEIELAKD SPPQTTRAKL RGDFIAAAQE AGRDFTVDWV 
HLKLNDQAQR TVLCKDPFRS VDERVERLIN SL