Gene Snas_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_4042
Symbol
ID	8885243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	4311364
End bp	4312455
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	70%
IMG OID
Product	hypothetical protein
Protein accession	YP_003512787
Protein GI	291301509
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00590442
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCGACC GACGCCAGGT ACTGCGATTT CGCGTCCACG CCCAGCAGCT CGACCGCACC 
AGCGGCGGAC TGGCCGACAC CACCGTCCTC GACTTCGGCG TCCAGGAGAC CGGCCCCGAC 
GGAGCGGGCT GGGCGCTGGC GATCCGTGGC GTCGACGTCG CCAACCTCGC CGCGACGGAT 
CTCATCACAC TGTGGACCCT GCGGGGAGCG CCCCACCGCT ACCGCCGCGC CGATGCCCCC 
GACGTGGCCG CGGCGGTGGC CCCGTACTCC GACGCCGACG CGGGCAAACG CATCTTCGAC 
GCCTCGAAAC CGTTGAAGGC GGCCGGAATC GGCAACGTGG AGGCACTGGA CGAAGTGGCC 
GGACAACTGC GCCGCCTCGT CACCGAACCG ATGGTCAAGG GAGACGTGTC GGGACGGCTC 
AACAAGGTTC TGGACGAGCC GTATCTGCGG TTCTGCCGCC CTTGCGACGC GATCCACATC 
TACGAGCAGC CGTTTCGGCT GGCGGCGATC CGCGCCGGGC TGGAGCTGCG ACCGGGGACC 
TCGCCGCCGG TACTGGAGCC GATCCCCGGG TTCAAGCCGT CGGCCACGGC GGACGAACGC 
TTCGACCTGG TGCGCTGCTA CCTGCGACTG CTGGGCCCGG CGACACCGAA ACAGGTCGCC 
GAGTTCCTGG ACGCGCCGGT CAAGGACGTG AAGGCGCACT GGCCCGAGGA CGTCGTGGCG 
GTGACGGTGG ACGGCGAGGA GCGCTGGCTG CTGGCGTCCG ATGAGGAGGC TCTGCGATCG 
GCGGCGGGTA AGGCGACGCG GCTGCTCGGG CCATACGACC TGTTCCTACA GGGACGGGAC 
CGCGCCACGA TCCAGCCGGA CAAGGCGCGG GCCAAGGAGC TGTGGCCGGT ACTGGGACGG 
CCGGGCGCGG TGCTGGTGGA CGGCGAGCTC GTCGGGGCGT GGCGGCCCCG TAAGTCCGGC 
AAGCGGATGA GCGTAACCGT CAAACCGTGG CAGACCATCG CCGCCGCCAC CCGCAAGGCC 
ATCAGCGAGC AGGCCGAGCG GCTGGCGGCG AATCGCGGGG CGGAACTGTC CACGATCGAG 
TTCGACGACT GA

Protein sequence

MTDRRQVLRF RVHAQQLDRT SGGLADTTVL DFGVQETGPD GAGWALAIRG VDVANLAATD 
LITLWTLRGA PHRYRRADAP DVAAAVAPYS DADAGKRIFD ASKPLKAAGI GNVEALDEVA 
GQLRRLVTEP MVKGDVSGRL NKVLDEPYLR FCRPCDAIHI YEQPFRLAAI RAGLELRPGT 
SPPVLEPIPG FKPSATADER FDLVRCYLRL LGPATPKQVA EFLDAPVKDV KAHWPEDVVA 
VTVDGEERWL LASDEEALRS AAGKATRLLG PYDLFLQGRD RATIQPDKAR AKELWPVLGR 
PGAVLVDGEL VGAWRPRKSG KRMSVTVKPW QTIAAATRKA ISEQAERLAA NRGAELSTIE 
FDD