Gene Shewana3_2028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_2028
Symbol
ID	4476393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	2425817
End bp	2426992
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	42%
IMG OID	639726611
Product	restriction modification system DNA specificity subunit
Protein accession	YP_869665
Protein GI	117920473
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.000400239
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTAAAGT TGGGCGATAT TTTTGATATA GCTAGGGGAG GATCGCCTCG CCCTATCGAC 
GACTATATAA CCGATGCCGA TGACGGGTTA AATTGGATAT CCATAAAAGA CGCTAGTAAC 
AGTAATAAAT ACATTAATTC AACAAAACTA AAAATTAAAC CTGAAGGTTT AACTAAAACT 
CGTATGGTTT ATCCAGGCGA TTTTTTGCTG ACAAACTCTA TGAGTTTTGG ACGGCCATAT 
ATTATGAATA CTACGGGATG TATTCATGAC GGATGGTTAG TACTATCAGG GAATCCGGAT 
AAAGTTAATT CGGATTATTT CTACTATTTA CTAGGAAGCG ATACTTTAAA ACAACGTTTT 
TCTGGATTAG CAGCTGGTGC TGTTGTCAAA AACCTCAATA CTGAATTAGT TAAAAGTGTG 
GAAGTCCCAC TCCCACCACT AGCCGAGCAA AAACGGATTG CTGCGATACT GGACAAAGCC 
GACGCCATCC GCCGCAAACG CCAACAAGCC ATCCAACTCG CCGACGACTT ACTCCGCGCC 
GTCTTCCTAG AAATGTTCGG CGACCCAGTC ACCAACCCAA AAGGCTTTCA GAAGTCAAAA 
TTGTCGGCTC TTGCCGACGT TATTACTGGA TTTGCGTTTA AAAGCGCTGA GTATGTCGAA 
GACAGTGATG ATGCTGTAAG GCTTTGTCGT GGGGTTAATA CACTGACTGG CTATTTTGAG 
TGGAAAGATA CTGCTTTTTG GGATTCAAAT AAAATAAATG GGCTACACAA TTACAAACTA 
GAAGCTGGCG ACGTGATACT AGCTATGGAC CGTCCATGGA TTTCAAGTGG ATTAAAGGTA 
TGTGTCTTCC CTGAAAACGA GCGAGATACA TATTTAGTTC AACGTGTAGC AAGAATCCGC 
TCAAAACAGC CACGTTATAC CGATTATTTG TATTCAAGCA TTTTGTCACC GGCATTTGAG 
AAGCATTGCT GTCCTACAGA AACAACAGTC CCTCATATTT CGCCAGTTGA ACTAAAGAAC 
TTTGAGATTC TGGTACCTGA TGAAAAATCA GTTAGCAAAT ATCACGATAT AGTCTCTAAG 
TTAAGGCGCT CGAAAGATCG AATGGAAATG AACTTGACTG AGGCTAATCA AATCTTCAAC 
TCGCTAAGCC AAAAAGCCTT CTCCGGCCAG CTTTAG

Protein sequence

MVKLGDIFDI ARGGSPRPID DYITDADDGL NWISIKDASN SNKYINSTKL KIKPEGLTKT 
RMVYPGDFLL TNSMSFGRPY IMNTTGCIHD GWLVLSGNPD KVNSDYFYYL LGSDTLKQRF 
SGLAAGAVVK NLNTELVKSV EVPLPPLAEQ KRIAAILDKA DAIRRKRQQA IQLADDLLRA 
VFLEMFGDPV TNPKGFQKSK LSALADVITG FAFKSAEYVE DSDDAVRLCR GVNTLTGYFE 
WKDTAFWDSN KINGLHNYKL EAGDVILAMD RPWISSGLKV CVFPENERDT YLVQRVARIR 
SKQPRYTDYL YSSILSPAFE KHCCPTETTV PHISPVELKN FEILVPDEKS VSKYHDIVSK 
LRRSKDRMEM NLTEANQIFN SLSQKAFSGQ L