Gene Shewana3_0640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_0640
Symbol
ID	4476850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	756338
End bp	757558
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	53%
IMG OID	639725175
Product	hypothetical protein
Protein accession	YP_868284
Protein GI	117919092
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000000356379
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCAGTA ACTTACATCA GGCTGGGGTG AAGCTACTCA AGCAGTTAGG TCGCCATGCT 
GACATCATTA TGGATGCCTA TCTGGCTGGC TCACTCAAGG AAGAGAGCCA TGATCCCGCC 
GTAGTTGAAA AACTCAAGCA GGCGGGGATT TTATGGCGCC CAGAGCCAGA CCAAGAGCTG 
CGCCTTAAAC GCTCGGTGCG TGCCTTGCTC GAAGAGGGCC TAAGTGATGA GCGCAATCGC 
CAAATCGACT CCAACGTCGG CTCGGCGCTC GCCACCATTA AGACCTTGGC CGACCACTAT 
AAAGAAGCGC GCCACAGCTC AGATTACAGT GCCGCCGAGG CGTATCTGTC TGATTTAAGT 
GAGCATGTGT ATAGCTTTGC CGACAGTTTA CGTTACTCCA TCCGCGTGTT GTGGGGACGC 
ATCAACAACG AGTTCGGTTA TGTCGGTACC ATTAACGCTA AGATCCGTGA AAACGAACTC 
GCCCAAAGCC AAGTGTCTGA ATTGCTCAAT GGCTTGGAGA TGTTCCAGTT TAGCGAATTA 
GGTGAAATCG CCGGTGATAT CCGTGAGCTG CGTAAGCTGC TGGTGACGAC TTTGCAGGAA 
ACCATGAGCG ACTGCGCTCA GGAACTCAGT GTGGTGCAGG GCAGGTTGCT GGAACTTCTC 
GGCCGTTTTA GGCAAATTCG CGGCCGTACC CGCTTGCTTA AGGGCTGGTT ACTGTACACC 
GATTTGCATC CGGATTATCG CCCTGCGGAC CATGTGTCCC ACAAGGAGAT CCCGAGTCTT 
TTCAATCGCG CCGAAGTGCT GTTGGCCCCA GCGTCTGTGG ATGTGCATAA CGCCAGCCAA 
GAGTTTGAGC TGATGAACAT CGTTGCCCAT ATCAAGGCGA TTAGCCGTCA GGGCATAGTC 
GAAACGGTGC GCGAGCAGGA TGTGGCCGTG CCGCTGACGC AGAATGAAGA CTTTGATATT 
CCTGATAATC CACTCAAGCA AGCGGTCGAC ACTTACTTTG TCGATGTGAT TGAGTCGGGC 
TTACGCCAGT CGGCGCTCGA TTACTTAGCC GAAAAAGCCC TGCCATGGGA TGCCGAAAGC 
TGGATTTATC AAGTGATTGG CGGCTACGAA GGTTTACCCG ATGAGCATAA GGCTTACTTT 
GAGTTAGAAC CCTTAGGCGA ACCTCACCCC ATCTACAGCG GTAACTTTAT TATCCGCGAT 
GTGGAATTAT GGCTCGCCTA G

Protein sequence

MSSNLHQAGV KLLKQLGRHA DIIMDAYLAG SLKEESHDPA VVEKLKQAGI LWRPEPDQEL 
RLKRSVRALL EEGLSDERNR QIDSNVGSAL ATIKTLADHY KEARHSSDYS AAEAYLSDLS 
EHVYSFADSL RYSIRVLWGR INNEFGYVGT INAKIRENEL AQSQVSELLN GLEMFQFSEL 
GEIAGDIREL RKLLVTTLQE TMSDCAQELS VVQGRLLELL GRFRQIRGRT RLLKGWLLYT 
DLHPDYRPAD HVSHKEIPSL FNRAEVLLAP ASVDVHNASQ EFELMNIVAH IKAISRQGIV 
ETVREQDVAV PLTQNEDFDI PDNPLKQAVD TYFVDVIESG LRQSALDYLA EKALPWDAES 
WIYQVIGGYE GLPDEHKAYF ELEPLGEPHP IYSGNFIIRD VELWLA