Gene Shewmr4_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1990
Symbol
ID	4252563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	2366420
End bp	2367556
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	51%
IMG OID	638118603
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_734120
Protein GI	113970327
COG category	[R] General function prediction only
COG ID	[COG3940] Predicted beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.00291978
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGCAA AACACAACAT GGATAATCGT CAACCTAACC TGTCGGTCTT TCGACGCTTG 
CCTTTGACCT GCGGCTTACT CGCCGCATTG GCGGTGCCAT TAGCACAAGC CGTGCCTGTG 
CTTGAGATTA GCCGCGCACA ATCCCACAGC GCCACGGTGC AAACCCTCGA TGCGAATGCG 
CCCTTTATCG AGAGAAGGGC GGATCCTTGG GTCATCCGCG ATGATGACGG CAGTTACTAC 
TTTATTGCCT CGGTGCCTGA GTTTGACCGC ATCGAACTTC GCCACGCCAA AACCATCGAC 
GGTTTACGCC AAGCAACACC TAAAACCCTG TGGCACAAGC ATGAAAATGG CCCCATGAGT 
ATCGATATTT GGGCACCTGA GCTGCACAAA ATCGATGGTC GCTGGTATAT CTATTTTGCG 
GCCAGCAATA AGGATGTGCG TTTTCATAAC CGCATGTTTG TCTTAGGACT TGAAGGCGAC 
TCACCGATGA CAGGCCAATG GCAAGAACTT GGTAAGTTAC AATCGGCGCA GGATGCTTTC 
TCCCTCGATG CGACCAGCTT TAGCCTCAAG GGCGAGCGAT ATTTTATTTG GGCGCAGCAG 
GACAAAGCCA AGCGTTACAA CACCGGCTTA GTGATTGCCA AAATGCTATC GCCAACTCAA 
CTCTCTGATA ACGAAACCAT TATCAGCGAG CCCTTATTGG ATTGGGAACG TTTGGGCTTT 
AAAGTCAACG AGGGCGCCGC TGTGTTGGTT AAAAACGGTA AAGTCTTCGT GACCTATTCC 
GCCAGTGCCA CGGATGACCG TTATGCCATG GGGCTGTTAT GGGCCGATGA AAATGCCGAT 
TTACTCGATC CCAAGAGTTG GCATAAATCG CCAAGCCCAG TCTTTACCAC TGAGCCTAGC 
TTGAATCGTT TTGGTCCTGG CCATAATAGT TTTGTGCTGG CAGAGGATGG TAAAACCGAG 
CTGATGTTTT ACCATGCACG TAATTACCTT GAGCTGCAGG GGACGCCATT GACCGACGGT 
AATAGACACA CTTACTACCG CGCCATTCGC TGGTCGGCGG ACGGTTTCCC AGTATTTGAT 
AATCCGCAGA GCGATAGCCA AACCTTGAAT CAGCAAGACA CGCAATCCCG CGAATAA

Protein sequence

MDAKHNMDNR QPNLSVFRRL PLTCGLLAAL AVPLAQAVPV LEISRAQSHS ATVQTLDANA 
PFIERRADPW VIRDDDGSYY FIASVPEFDR IELRHAKTID GLRQATPKTL WHKHENGPMS 
IDIWAPELHK IDGRWYIYFA ASNKDVRFHN RMFVLGLEGD SPMTGQWQEL GKLQSAQDAF 
SLDATSFSLK GERYFIWAQQ DKAKRYNTGL VIAKMLSPTQ LSDNETIISE PLLDWERLGF 
KVNEGAAVLV KNGKVFVTYS ASATDDRYAM GLLWADENAD LLDPKSWHKS PSPVFTTEPS 
LNRFGPGHNS FVLAEDGKTE LMFYHARNYL ELQGTPLTDG NRHTYYRAIR WSADGFPVFD 
NPQSDSQTLN QQDTQSRE