Gene Tgr7_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tgr7_1778
Symbol
ID	7317588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thioalkalivibrio sp. HL-EbGR7
Kingdom	Bacteria
Replicon accession	NC_011901
Strand	-
Start bp	1891507
End bp	1892766
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	52%
IMG OID	643616670
Product	type I restriction-modification system specificity subunit
Protein accession	YP_002513847
Protein GI	220934948
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.926504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGTGA GGGAGGCAAG TGCGAAGTAT CTGCCGCCGG AGGCCGAGGG GTGTCCGGCG 
GGGTATAAGC AGACTGAGGT GGGTCTGGTG CCGTTGGATT GGGAGGTCAT ATCTCTTGAT 
AAGTTCGCAG ACGTCACGAG CGGCAAGCGT CTGCCTTTGG GGCGTTCACT GACAGAGCAT 
GAAACGCCAC ACCCGTACAT CCGCGTCTCG GATATGCGCC CTGGATATGT CTGCGTTGAT 
GAGATTCGGT ACGTTCCAGT GGATGTGTTC CCGAAGATTA AGCGGTACCG GATCTATACA 
GACGATATTT TTATATCCGT GGCGGGAACG CTCGGGATTG TCGGTAAGAT ACCGAAGCGA 
CTCAATGGCG CGAACTTGAC TGAGAACGCT GATCGCATAA CGAATATAAA GTGCTCACAA 
AATTATCTTC TGCATGTTCT GATGTCGCCG TTGATTCAGA GCAAGATTGA ATCTATTCAA 
ACAGTCGGCG CACAGCCAAA ACTGGCTTTG ACGAGGATTC GGAAGTTCGA GATTCCGCTA 
CCCCCAACAG ATAGAGAGCA GCAAGCCATC GCCTCCGCCT TGAGCGATGC GGACGCCCTC 
ATCGAATCCC TCTCGCAGCT CCTCGCCAAG AAACGCCAGA TCAAACAAGG CGCCATGCAG 
GAACTGCTCA CCGGCAAGCG GCGCCTGCCG GGGTTTAGTG GGGAGTGGGA TGTGAAGCGG 
TTGGGTAGTG TTTTGAAATT CCAAGTGGGA TTTCCATTTA GTTCAATTTA TTTCAACGAT 
GAATTTCAAG GGATCCGACT GATCAAGAAT CGTGATCTTA AAGCTAGTGA CCAGATCATT 
AGCTACACCG GAGATTATCG GCATGAATTT CTCGTCAAAG ATGGAGATTT GCTGATTGGA 
ATGGATGGTG ATTTCATCCC ATGCTTGTGG GGTGAAGGGG TTGCTCTTCT GAATCAGCGG 
GTTGGGCGGG TTATTCCGCT TTCTGGATTA GATGCAAAAT TTGCCTACTA CTATCTAATT 
GCGCCGTTGA AGAAAATCGA GGATTCAACG TCAAGCACAA CTGTTAAGCA CTTGTCTCAT 
GGGGATGTGG AAGGTATCGA AGAGCCTCTT CCGGAAGTTG AGGAACAAAT CGCTATCGCT 
ACCACCCTCT CCGACATGGA CGCCGAAATT GCCACACTGG AGGCGAAGCT CGCCAAGGCC 
CGCCAGCTCA AGCAGGGCAT GATGCAGGCG CTGCTCACCG GTCGGATCCG GCTGGTATGA

Protein sequence

MEVREASAKY LPPEAEGCPA GYKQTEVGLV PLDWEVISLD KFADVTSGKR LPLGRSLTEH 
ETPHPYIRVS DMRPGYVCVD EIRYVPVDVF PKIKRYRIYT DDIFISVAGT LGIVGKIPKR 
LNGANLTENA DRITNIKCSQ NYLLHVLMSP LIQSKIESIQ TVGAQPKLAL TRIRKFEIPL 
PPTDREQQAI ASALSDADAL IESLSQLLAK KRQIKQGAMQ ELLTGKRRLP GFSGEWDVKR 
LGSVLKFQVG FPFSSIYFND EFQGIRLIKN RDLKASDQII SYTGDYRHEF LVKDGDLLIG 
MDGDFIPCLW GEGVALLNQR VGRVIPLSGL DAKFAYYYLI APLKKIEDST SSTTVKHLSH 
GDVEGIEEPL PEVEEQIAIA TTLSDMDAEI ATLEAKLAKA RQLKQGMMQA LLTGRIRLV