Gene Snas_5036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5036
Symbol
ID	8886243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	5345185
End bp	5346363
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	71%
IMG OID
Product	glutamate--cysteine ligase GCS2
Protein accession	YP_003513766
Protein GI	291302488
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.293374
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGGTA CGGCTCAGCA TGCTCACATA ACGCGCTTCA TCGACCCCGT TCCCCCCACC 
GCCGGTATCG AGGAGGAGTT CTTCCTCGTC GACCCCCACA CCCGCCGGGT CGCCCCCGAC 
GCGGCGGAGG TGGTGCGGCG GGCCGGGACC TGGAGCGGCG GCTCCATCAG CACCGAGTTC 
ACCAAATACC AGGTGGAGAC CCGCACCGAT CCGTTCTCCG ATGTGGACGA TCTGGCCACC 
GAGGTGGCCC GGATGCGCGA CATCGCCGCC ACCGCCGCGA CCGAAGCGGG GCTGCGCGTC 
ACCGCGACCG GCACCCCCGT GCAGGGCGAC ATCGTCCCGC CGCCGATCGC CGACATCCCC 
CGCTACCGCG AGACCACCGC GATGTTCCGC ACACTGCAGG ACGGACAGAG CATCAGCGCC 
TGCCACGTCC ACGTGCACAT GCCCGACCCG GAGCTGGCGG TACTGGTGAG CAATCACCTG 
CGACCCTGGC TGCCGGTGCT TTTGTCCATG AACGGGAACT CGCCCTACTG GGCCGGACGC 
GACACCGGCT ACGCCAGCTG GCGGACGCTT TCCTGGAGCG GCTGGCCGGT CGCCGGTCCG 
CCGCCGTACT ACGAATCGCG CGACCACTTC GACGAACTCG TCGGCACCCT GGTGGCCGGT 
GGCGCCCTGA TGGACCGTCG CTCGATCTTC TGGGACGTCC GCCCCTCGGC GCATCTGCCG 
ACCATCGAGG TCCGGGTGGC CGACGTCGCC GCGACCGCCT TCGAGGGGCC GCTGTTCGCC 
GCGCTGGTGC GTGCCCTGGT GACGCTGGCG GCCCAGGCGG TGCGGCACGG TGACCGGGGC 
CCGAGGACCG CCCCGGAACT GTTGCGGGCC GCGAGCTGGC GCGCCGCGCG AGACGGCTTG 
GAGGGCAAGG GAATCGACAC CCGCACCGGG AAACTGCGCG ACGCCGGGCA GCTGGTCGAG 
TCGCTGCTGG CCGAGGTCCG TCCGATCCTG ACGGTCTGGG GAGAGTGGGA CCGGGTGACC 
GGCTGGTGGC AACGGCTGCG GTCAATCGGC AGCGGTGCCG CCCGGCAGCG CGCGGCCTAC 
GCCGAGCGCG GTCACCTGGA CGACGTCGTC GACTGCCTCA TCGAACAGAA CCGGCCCGGT 
TCGCTCCACA AGGGGCGCAC CGTGGTCCAT AGTGGCTGA

Protein sequence

MAGTAQHAHI TRFIDPVPPT AGIEEEFFLV DPHTRRVAPD AAEVVRRAGT WSGGSISTEF 
TKYQVETRTD PFSDVDDLAT EVARMRDIAA TAATEAGLRV TATGTPVQGD IVPPPIADIP 
RYRETTAMFR TLQDGQSISA CHVHVHMPDP ELAVLVSNHL RPWLPVLLSM NGNSPYWAGR 
DTGYASWRTL SWSGWPVAGP PPYYESRDHF DELVGTLVAG GALMDRRSIF WDVRPSAHLP 
TIEVRVADVA ATAFEGPLFA ALVRALVTLA AQAVRHGDRG PRTAPELLRA ASWRAARDGL 
EGKGIDTRTG KLRDAGQLVE SLLAEVRPIL TVWGEWDRVT GWWQRLRSIG SGAARQRAAY 
AERGHLDDVV DCLIEQNRPG SLHKGRTVVH SG