Gene Shewmr4_3027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3027
Symbol
ID	4253598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	3619931
End bp	3621406
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	51%
IMG OID	638119669
Product	N-acetylglucosamine-binding protein A
Protein accession	YP_735155
Protein GI	113971362
COG category	[S] Function unknown
COG ID	[COG3397] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.483728
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACATC TAACTGCTTT TACATCAATC ACAAATGCTA ACCACAAACA CCCACAACTG 
GCTCGTTTAA GCCTAATTGC CTTGGCCCTA AGCGCTACGA GTGCGCTAGT TAGCCAAACG 
GCGTCGGCCC ACGGTTATGT GGTTTCACCA GAATCACGCT CATACGCCTG TAAAACTGGC 
AGCAATTTAA ACTGCGGCGC CGTTCAATGG GAACCGCAAA GTGTTGAAGG TCCATCAGGT 
TTTCCTGAGT CAGGCCCTGC CGACGGCAAA ATTGCCAGCG CAGCCAACGC AGCGTTTTCT 
CCCTTGGATG AACAGAGCCC AAGTCGTTGG TCTAAGCATG ACATTAAGTC GGGTTGGAAT 
GACTTTAGCT GGCAGTTCAC CGCTAACCAT GTGACCCGCA ATTGGCGTTA CTATTTAACT 
CGTCAAGGCT GGGATCAAAA CCAAGCCTTG AGCCGTGCAA GCTTTGACTT AGCTCCCTTC 
TGTGTGGTCG ACGGAGGTAT GGTTCAGCCG CCTAAGTTAG TGACACATAA CTGTTATGTG 
CCTGAAGACA GAAGCGGTTA TCACGTGATT TTGGCCGTGT GGGAAGTCGG TGATACCACC 
AACAGTTTCT ATAATGCTAT CGATGTGAAC TTTAGCTCTG GTGTTGTGGT GCCGGGCGAG 
TGGACCGATA TTGGCGATAT CAATCCGTCA CTTGATCTTA AGGCGGGTGA TAAGGTGATG 
ACGCGGGTGT TTGATGCTAA TGGCGAGCAA ACTGCCAAGC AGACTCAGAT AACCATTGCC 
GACACTACTC AAGGTGCCAA GCAAAATTGG CCATTCCTGT TAGCCAGTGC CATTAATGCC 
CAGCAGCCAC AACTTAAGGC GGGGCAGAAG AATCCCTCTG GGGTGATCTC GCCCGTTTAC 
GGTAAAAATG AGATTTATGC CGCGCCTAAT TCGGGCCTAG AGCGAGTGGA AGTGAGCTTT 
GATATTGCGC CTGCGCCGGG CAATCAGCTC GATGTCACGT CACTGGCCGA TGATTACACT 
ATTGTCGATG GTGCCGCAAA GGTCAGCTTC GATGTCAGCA CTAATGCGGA TATGCAGGTC 
TCGGCTTACC TATTTAGCCA CGATGGCACG GCAGCTGGAT ATGTCACACA AGTGGTTAAT 
AATACTAGCG CGAGTCTAGT GCTTGATGTC GTCGCGCCTA AGGCTGGCCA TTATCACTTA 
CAAGTGAAGG GCGAGCCGAA GCAAGGTGAG GTTATCCAGC AAAACTTCGA TCTGTTCTTA 
AAAGATCAAG CCACAGCGCC GGATGCCGAT TATGTCTTCC CCGAGGGCAT TAAAAACTAT 
GTGGCGGGTA CTAAAGTGCT GCAACCTAAA ACTGGCAAGG TCTATCAATG TAAACCTTGG 
CCTTACAGTG GTTATTGCAT GCAATGGTCG CCAACTGCAA CCGGGTTTGA ACCGGGTGTC 
GGCGGCTCTT GGAATATGGC TTGGACTGAG CTGTAA

Protein sequence

MAHLTAFTSI TNANHKHPQL ARLSLIALAL SATSALVSQT ASAHGYVVSP ESRSYACKTG 
SNLNCGAVQW EPQSVEGPSG FPESGPADGK IASAANAAFS PLDEQSPSRW SKHDIKSGWN 
DFSWQFTANH VTRNWRYYLT RQGWDQNQAL SRASFDLAPF CVVDGGMVQP PKLVTHNCYV 
PEDRSGYHVI LAVWEVGDTT NSFYNAIDVN FSSGVVVPGE WTDIGDINPS LDLKAGDKVM 
TRVFDANGEQ TAKQTQITIA DTTQGAKQNW PFLLASAINA QQPQLKAGQK NPSGVISPVY 
GKNEIYAAPN SGLERVEVSF DIAPAPGNQL DVTSLADDYT IVDGAAKVSF DVSTNADMQV 
SAYLFSHDGT AAGYVTQVVN NTSASLVLDV VAPKAGHYHL QVKGEPKQGE VIQQNFDLFL 
KDQATAPDAD YVFPEGIKNY VAGTKVLQPK TGKVYQCKPW PYSGYCMQWS PTATGFEPGV 
GGSWNMAWTE L