Gene Snas_4221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_4221
Symbol
ID	8885422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	4516642
End bp	4518222
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	67%
IMG OID
Product	Terminase
Protein accession	YP_003512963
Protein GI	291301685
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.329871
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.306119
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGCC CCCGCGGACT ACCCGAGCGC ACTCTCGGCT GGGAAGTCCT GGCGTGGACG 
GCCGCTTATC TCCACCAGCC CGACGGCCCC TATGCCGGGA ACCCGTGGCG GGCAACGCCT 
GAGCAGGTCC GACACGTTTT GTGGTGGTAC GCGATCGACG AGGCTGGGCG GTTCCTGTAC 
CGCCGGTCGA TCTTGCGCCG GTCGAAGGGC TGGGGCAAGG ACCCGGTCGC CGCCGTGCTG 
TCGCTGGTCG AGCTGTTGGG CCCGTGCCGC TACGGAGGCA CCAACGCCCA AGGCCAGCCG 
GTCGCGGTGC CGCATCCGTC CCCGTGGGTG CAGATTGCCG CGACGTCCGA GGCGCAGACG 
GTCAACACGA TGTCGCTGAT TCTGTCCATG CTGGAATACG GTTCGCTGGT CGACGACTAT 
TCGCTCGACG TCGGCAAGAC CCTCATCTAT ACCCCGCGCG GGCGTCTGCA TGCGGTGACC 
TCATCCCCGC GAAGCCTGGA AGGCCCCCGA CCGTCCTATG TGGTTCTCGG GGAGCCTCAG 
AACTGGTTGC CGTCCAACGG CGGCCAAGCC ATGTCCGAGG TGATCCGTCG CAACCTCGGC 
AAGAGCCGCG ACGGCGCGGC GCGAAGCACC GAGATCGGTA ACGCGCACTT GCCCGGCGAG 
GATTCCGTCG CTGAGTCGTC CTATGAGGCG TGGCTTTCGA TGGTCGAGGG CCGCTCGCGT 
GACACCGGCA TCCTGTACGA CTCCCGCGAG GCACCGCCCG ACACGGACAT GAGCGACCCC 
GAGTCCCTGC GGGCGGGACT TCGCGCCGCC TACGGTGACA GTCATTGGGT TGACCTCGAT 
CGGGTCATGG GCGAAATCTG GGACCCGGCC ACCCCGCCCA GCGTCTCGCG GCGTTACTAC 
TTGAACCACG TCACCGCCGC TGAGGACGCG TGGTGCGCCG CCCACGAGTG GGACTCGTGC 
GAGACCACCG ACCGGATTCA ACCCGGCGAC ACCGTCACTA TTGGATTCGA CGGGTCGGTG 
TCGGACGACT CCACCGCCAT CGTGTTGTGC CGCGTCGACG ACGGCCTCGT CGACCTGGCG 
GCGGTGTGGG AGAAACCCGA CGGACCGGCG GGCGATGACT GGCGCGTGCC GCGCGACCAG 
GTCGACGAGA TGGTCGACCA CCTCATCGCC ACCTATGACG TCGCCGCCGA TTACAGCGAC 
GTCGCCTATT GGGAGTCCTA TATCGATACC TGGTCGATCA GGTACGCCGA CGTCGTGCGG 
CACAAGGCGA GCCCTAAGTC GCTCTTCGGG TGGGACATGC GAAGCCATGC CAAGGAATTC 
GTGTTGCGGG GCGCCGAGGC GACGCTGTCG GCGATCACCG ACGGGACGTT GAAACACACC 
GGCAATCCGA TCCTACGTAG ACACGTCCTC AACGCACGAC GCCGACCGAA TCGGTGGGGG 
CTGTCCTTCG GCAAGGAATC CCGAACCAGC TCCCGCAAGG TTGACGCCGT AGCCGCGATG 
TGCCTTGCCC GCATTGCCCG CGCCGACGTA CTCGCCACCG GTGCCGGACG CCAACGCACC 
GGCGAAGTCT GGGCCCTGTA G

Protein sequence

MTGPRGLPER TLGWEVLAWT AAYLHQPDGP YAGNPWRATP EQVRHVLWWY AIDEAGRFLY 
RRSILRRSKG WGKDPVAAVL SLVELLGPCR YGGTNAQGQP VAVPHPSPWV QIAATSEAQT 
VNTMSLILSM LEYGSLVDDY SLDVGKTLIY TPRGRLHAVT SSPRSLEGPR PSYVVLGEPQ 
NWLPSNGGQA MSEVIRRNLG KSRDGAARST EIGNAHLPGE DSVAESSYEA WLSMVEGRSR 
DTGILYDSRE APPDTDMSDP ESLRAGLRAA YGDSHWVDLD RVMGEIWDPA TPPSVSRRYY 
LNHVTAAEDA WCAAHEWDSC ETTDRIQPGD TVTIGFDGSV SDDSTAIVLC RVDDGLVDLA 
AVWEKPDGPA GDDWRVPRDQ VDEMVDHLIA TYDVAADYSD VAYWESYIDT WSIRYADVVR 
HKASPKSLFG WDMRSHAKEF VLRGAEATLS AITDGTLKHT GNPILRRHVL NARRRPNRWG 
LSFGKESRTS SRKVDAVAAM CLARIARADV LATGAGRQRT GEVWAL