Gene Shewana3_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_2066
Symbol
ID	4476312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	2473107
End bp	2474609
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	50%
IMG OID	639726651
Product	L-arabinose isomerase
Protein accession	YP_869702
Protein GI	117920510
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2160] L-arabinose isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000205701
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000020018
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGCCT TCAAACAAAA ACAAGTGTGG TTTATCACGG GTTCGCAGGA TTTATACGGC 
CCAAAAGTAT TAGAGCAAGT CGCTAAAAAC AGTGAGCAAA TTGTTCATGG CTTTAATGAA 
TCATCCGCCA TTTCCATCGA AGTGGTGTAT AAGCCAACCG TAAAATCCCC ACGGGAAATT 
CACGCCGTAT GCCAAGCGGC CAACAGCGAT GAAAACTGTG TTGGCGTTAT TCTGTGGATG 
CACACTTTCT CTCCAGCCAA GATGTGGATT GCTGGCCTTA ATGAATTAAG CAAGCCATTC 
ATGCACTTAC ACACGCAGTT CAATGCTGAG CTCCCTTGGA GCGAAATCAA CATGAACTAC 
ATGAACACCC ACCAAAGTGC TCACGGTTGC CGCGAATTTG GTTTTATCGG CACTCGTATG 
CGTAAAGAGC GCAAAGTGGT TGTGGGTCAC TGGCAATCGA GCGATGTACA GGCTCAAATC 
GATGATTGGT GCCGCGCAGC GGCAGGTTGG CACGAGAGCC AAAACCTGCG TATCGCCCGC 
TTTGGCGACA ACATGCGTCA AGTGGCCGTA ACCGAAGGTG ACAAAGTTGC CGCACAAATT 
CAATTCGGTT ATGAAGTGCA CGCCTACAGC TTAGGTGAAC TCAATGAGGC GATTGCAGAC 
ATTGCCGAAG GCGATGTAAC CGCACAACTC GACCGTTACG CCAGCGAATA CCAAGTAGGT 
AACGAGCTAT TTGGCGATGA ATACCAATTA GACCGTTTAA GAAAAGAAGC CAAGATTGAA 
CTCGGCTTAA CCCAATTCTT AACCCAAGGT GGATTTGGTG CCTTTACCAA CTGCTTCGAA 
AACCTCACTG GCATGACAGG ATTACCCGGA CTGGCTACTC AACGTCTGAT GGCGAACGGT 
TTCGGTTACG GCGGCGAAGG TGACTGGAAA ACGGCTGCCA TGGTGCGCAT CATGAAAGTG 
ATGGGCCAAG GCCGTGCCGG TGGTACTTCA TTTATGGAAG ACTACACCTA TAACTTTGGC 
GCGACTGACC AAGTTCTTGG CGCCCACATG CTAGAAGTGT GCCCATCGAT TGCTGCTGCA 
AAACCGCGTT TAGAAGTTCA CCGCCACACC ATTGGTGTGC GTTGTGACGT GCCACGTCTG 
TTATTCACTG GTAAAGCGGG CCCAGCAATC AACGTATCGA CTATCGATTT AGGCAACCGT 
TTCCGTATCA TTCTTAATGA ATTAGATACA GTGACACCAC CACAGGATCT GCCAAATCTG 
CCTGTCGCGT CTGCGCTGTG GGAGCCTCGT CCGAATTTAG CGGTTGCCGC CGCAGCTTGG 
ATCCACGCCG GTGGTGCTCA CCACTCAGCT TACAGCCAAG CTATCACGAC GGATCAGATT 
GTCGACTTTG CTGAAATGGC CGGTGCTGAA CTGGTTATCA TCGATGCCGA CACTAAGATC 
CGCGAGTTTA AGAATGAGCT TCGCCAAAAT TCCGTTTATT ACGGTTTAGC AAGAGGTTTA 
TAA

Protein sequence

MKAFKQKQVW FITGSQDLYG PKVLEQVAKN SEQIVHGFNE SSAISIEVVY KPTVKSPREI 
HAVCQAANSD ENCVGVILWM HTFSPAKMWI AGLNELSKPF MHLHTQFNAE LPWSEINMNY 
MNTHQSAHGC REFGFIGTRM RKERKVVVGH WQSSDVQAQI DDWCRAAAGW HESQNLRIAR 
FGDNMRQVAV TEGDKVAAQI QFGYEVHAYS LGELNEAIAD IAEGDVTAQL DRYASEYQVG 
NELFGDEYQL DRLRKEAKIE LGLTQFLTQG GFGAFTNCFE NLTGMTGLPG LATQRLMANG 
FGYGGEGDWK TAAMVRIMKV MGQGRAGGTS FMEDYTYNFG ATDQVLGAHM LEVCPSIAAA 
KPRLEVHRHT IGVRCDVPRL LFTGKAGPAI NVSTIDLGNR FRIILNELDT VTPPQDLPNL 
PVASALWEPR PNLAVAAAAW IHAGGAHHSA YSQAITTDQI VDFAEMAGAE LVIIDADTKI 
REFKNELRQN SVYYGLARGL