Gene Snas_5220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5220
Symbol
ID	8886429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5546315
End bp	5548357
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	70%
IMG OID
Product	5-oxoprolinase (ATP-hydrolyzing)
Protein accession	YP_003513947
Protein GI	291302669
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.46382
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.858688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCACG AGACCCGGGT GGCCATCGAC GTCGGCGGGA CGTTCACCGA CGTCGTCACG 
CTTCGGCCCG ACACCGGCGA GTTCCGGTTC GAGAAGGTCC CCACCACCCC CGAGGCCCCC 
GCGCGCGGCG TCCTGGACGC CTTCGGCGCG GCCGAAGTGG ACATGCCGGA CGTGTCGATG 
TTCAACCACG GCACCACCCT GGGACTGAAC TCGCTGCTGA CCCGCACCGG CGCCAAGGTG 
GCCGTGGTCG GCACCCGGGG CTTTCGCGAC GTGTACCTGC TGGGCCGCAC CAACCGCGAC 
GTCATGTACG ACATCGCCTA CCGCAAACCC GAACCGCTGC TGGAACGCTA CGACACCTTC 
GAGGTCGCCG AACGGTCCTA TTTCGACGGC ACCGTCGCGA CCCCGCTGGA CGAGGCCGAC 
GCGGCCCGCG TCGCCGCCCA GATCGGCGAG CGCGACTACC AGGCCGTCGC GGTGGCATTC 
CTGCACTCCT ACGCCAATCC GGCGCACGAG ACCCGGATGC GCGAGATCCT GCTGGAACAC 
TGTCCCGACG TCGAGGTGAC CGTCTCGCAC GAACTGTCCC GCGAGTACCG GGAGTACGAG 
CGCACCTCCA CCGCGGTGCT GGACGCCTAC ATCAAGCCGA TCGTCCGGCG CTACCTCGCC 
GAACTCGACG ATGGACTCAC CGACGCCGGA TTCGGCGGCC GGTTCCTGAT GTCGCGGTCC 
GGTGGTGGCG CCATGACCGC CGAGGCCGCC CGGGAACAAC CGGTCAACCT GATCCTGTCG 
GGCCCCGCCG GCGGCGTGGT CGGCGCGGCC GGGTTCGCGA AACTGTTGGG GCGCCCCAAT 
CTCATCACCA TCGACATGGG AGGAACCAGC CTGGACGCGT CGCTGGTTCT GGACTCCACC 
CCGGTCGCGC ACCAGGGCGC CGAGTTCGAG GGGATGCCCA TCAACACGCC CTCGCTGTAC 
ATCCACACCA TCGGCTCGGG CGGCGGCTCC CTTGTGTACC TCGACGACGC CGGGGCGTTG 
CAGGTCGGCC CGAAGAGCGC CGGGGCGGTA CCGGGTCCGG TGGCCTACGG TCGCGGCGGC 
ACCCGGCCCA CCTTCACCGA CGCGGCGCTG GCCGTCGGTT ACCTCGGCGC CGACACGCCG 
CTGGGCGGCA CACTCGCTCT CGACGCCGAC GGTGCCCGGG AAGCGTTGCG GCCCATCGCG 
AACCAACTGA ACTACTCCAC CGAGGAACTC GCGCGCGGCG TCCTGCGCAT CACGAACACG 
AAGATCATGG GCGCGGTACG GGCGATCACC GTGGAACTCG GCCACGACCC CAAGGACTTC 
GCGCTGCTGT CCTTCGGCGG CGCCGGGGGA CTGGTCGCCG TCGACGTGGC CCGCGAACTG 
GGCATCCCCG AGGTGGTCGT GCCGCCGGGA CAGGGCGCCT TCTCGGCGCT GGGCATGCTC 
ATGGCCGACG TCCAGCACGA CCTGTCCCGC ACCGCCGTCA CCGCCCTGGC CGATGTGGAC 
CTCGACGGGA TGGGCGCCGC CTACGCCGAC CTGGAGGCCG AGGCCGCCGT CCAGCTGGAA 
CACGAGGGCT TCGCCCCCGA AGCCCGGCGC TACGAACGCA GCGTCGACGT GCGCTACAGC 
GGCCAGGAAC ACTCGGTCAG CGTCGCGTTC CCCTCCGCTG TGGACGACAC GATCGCCGTG 
ATCGAGGCCG AGTTCGCCGA AGCCCACCGA CGCCAGTACG GCCACGTCAT GGACGACCCG 
GTCGAGATCA CGACACTGCG GCTGCGCGCC ACCGGCGTCG TCGACAAACC CGAACTCCCG 
TTGGCGCCCA AACGAACCGG CGAACCACTG CGACCGCGCG GCAGTCGGGT GGTGCACGAG 
ACCGACGGCT CCACCGCCGA CTACGCGCGC TACGCCCGCG AGGACTTCGC CGCCGGAGAC 
GCCTTCACCG GACCGGCCGT GGTCACCGAG CACACCGCCA CGACGGTGCT GCACGACGGC 
GACCGGCTCG ACGTCGGGCC GCACGGCGAA CTCGTCATCA CACTCGGAAG GGAAACGGCA 
TGA

Protein sequence

MQHETRVAID VGGTFTDVVT LRPDTGEFRF EKVPTTPEAP ARGVLDAFGA AEVDMPDVSM 
FNHGTTLGLN SLLTRTGAKV AVVGTRGFRD VYLLGRTNRD VMYDIAYRKP EPLLERYDTF 
EVAERSYFDG TVATPLDEAD AARVAAQIGE RDYQAVAVAF LHSYANPAHE TRMREILLEH 
CPDVEVTVSH ELSREYREYE RTSTAVLDAY IKPIVRRYLA ELDDGLTDAG FGGRFLMSRS 
GGGAMTAEAA REQPVNLILS GPAGGVVGAA GFAKLLGRPN LITIDMGGTS LDASLVLDST 
PVAHQGAEFE GMPINTPSLY IHTIGSGGGS LVYLDDAGAL QVGPKSAGAV PGPVAYGRGG 
TRPTFTDAAL AVGYLGADTP LGGTLALDAD GAREALRPIA NQLNYSTEEL ARGVLRITNT 
KIMGAVRAIT VELGHDPKDF ALLSFGGAGG LVAVDVAREL GIPEVVVPPG QGAFSALGML 
MADVQHDLSR TAVTALADVD LDGMGAAYAD LEAEAAVQLE HEGFAPEARR YERSVDVRYS 
GQEHSVSVAF PSAVDDTIAV IEAEFAEAHR RQYGHVMDDP VEITTLRLRA TGVVDKPELP 
LAPKRTGEPL RPRGSRVVHE TDGSTADYAR YAREDFAAGD AFTGPAVVTE HTATTVLHDG 
DRLDVGPHGE LVITLGRETA