Gene Snas_1017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_1017
Symbol
ID	8882202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	1079566
End bp	1080786
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	60%
IMG OID
Product	transposase IS605 OrfB family
Protein accession	YP_003509820
Protein GI	291298542
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.347453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.000143802
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGAACGG CGTACAAGTG CCGGGCCTAT CCCGATTCCG AACAGGCGGC CATGTTGAGC 
CGTACATTCG GATGTGTGCG TCTGGTATGG AACAAGACCC TCGCTGAACG TCATCACAGA 
TATCACTCTG AGGGAAGACG CACTTCGTAC CGGGAAACGG ACGCCACGCT GACAGCATGG 
AAGAAGACGC GCGAGCTAGC ATTCCTTTCC GAAGTGTCGT CGGTGCCGTT GCAGCAGACA 
CTCCGTCACC AGCACGCCGC CTTCGCGAAC TTCTTTGCCG GAGGAGCCAA GTATCCGAGA 
TTCAAGAACC GAAACTGGCG CCAATCGGCC CACTACACCC GGGCAGCGTT TCGCATGCGG 
GATGGTCAGC TGTGGCTGGC GAAGGCATCC GCGCCGCTGC GATTCGTCTG GAGCTGGGAC 
AATATCGACT TGGTCGCGCT CAAGCCGACG ACGGTAATCA TCTCGCGGGA ACCGGACGGC 
CGCTGGTACG TCGCGTTCGC AGTCGACATC GATGCGCCAG CTCCCTTGGA GGAGACGAAG 
CACGCTGTTG GCATCGATGT GGGGATAAAG AACTTTGCCG TAACCAGCGA CGGCGAGCGA 
ATTCGCAACC CATGTCACTT GGAACGCAAA TCTCGCAACC TTGCCCGCTA TCAGCGCAGA 
ATGGCTCGTT GCCAACGCGG CAGTATGAAT CGGCGTAAGG CGAAGGCGAA AGTCGCTCGT 
ACCCACCGCA AGGTTCGCAA CGCTCGTCAA GACTTCCTAC ATCGCACATC GGCAAACCTG 
GTCCGCAAAG CCGACATTGT CGTCGTCGAA GATCTCGGCG TACGAAACAT GGTGCGCAAC 
CGGCGCTTGG CGCGTGCTAT CTCCGATGCA GGTTGGAGCG AATTCCGGCG GCAGCTGGAG 
TACAAATGTC AACGTGCCGG ACGCCGTCTG GTGGTAATCG ATCGCCACTA CCCCTCTTCC 
AAGACATGCA ACGCCTGTGG GCATTTGCTA GCAAAACTGA ACCTGGGTAC CCGGGCATGG 
ACGTGCCCCT CCTGCCGCGC CCGCCACGAT CGGGATCACA ATGCGGCCAA GAACATCCTT 
GCGGCAGGTC TTGCCGTAGC TGCGGCCGAA AGCCGTAGCG ATGCCTGTGG AGCTGATATC 
AGACGGCAAG GGCCCGCCCT TCCGCGATCG GCGGCGAATC AGGAAACTCA CCCCGTGAGG 
GGTGTGACCC CTCATCCTTA G

Protein sequence

MRTAYKCRAY PDSEQAAMLS RTFGCVRLVW NKTLAERHHR YHSEGRRTSY RETDATLTAW 
KKTRELAFLS EVSSVPLQQT LRHQHAAFAN FFAGGAKYPR FKNRNWRQSA HYTRAAFRMR 
DGQLWLAKAS APLRFVWSWD NIDLVALKPT TVIISREPDG RWYVAFAVDI DAPAPLEETK 
HAVGIDVGIK NFAVTSDGER IRNPCHLERK SRNLARYQRR MARCQRGSMN RRKAKAKVAR 
THRKVRNARQ DFLHRTSANL VRKADIVVVE DLGVRNMVRN RRLARAISDA GWSEFRRQLE 
YKCQRAGRRL VVIDRHYPSS KTCNACGHLL AKLNLGTRAW TCPSCRARHD RDHNAAKNIL 
AAGLAVAAAE SRSDACGADI RRQGPALPRS AANQETHPVR GVTPHP