Gene Shewana3_3441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_3441
Symbol
ID	4476784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	4123590
End bp	4124747
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	52%
IMG OID	639728050
Product	hypothetical protein
Protein accession	YP_871070
Protein GI	117921878
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2039] Pyrrolidone-carboxylate peptidase (N-terminal pyroglutamyl peptidase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00415893
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.25947
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAAAGC CAAGCCTCGT TTTTATCCTC GCCAGCACAG TGGCGCAAAC CGCAGGTGCA 
GTACAACTCC TAGGAGATGT GGAAGTTTCC CGCATTCCCA CTGCAGAAAA AACCATGGCA 
GAAGTGGTCT ACCGCTATCA AGCCTTGGAC GAAGGCTTGG CGACTCAGCT TTCCGCACAG 
AAGAATGAAC GCGATGCAAC CCAACTTGCC GCTCGTCAGG GGCATAGACT GTGGCAACAG 
GCGGTGCGTG ATGTGCAGTC AGGGCACTTT GACGACAGAT CCCTCTACTG GGCTCGGCTC 
TCAATGTTAA ATAGCATCAA GAGCAATCGC GCCAATTTCA AAATGGCCGA TTGGCAACAG 
AATATTTTAG CCAGCGCAGT CGAAAAGGCA TCTCGCGGTT TTAGCGATAT CCAATACGGC 
GACGATGTGC AGATAAAAAT CTTCCTGACG GGATTCGACC CTTTCTTCCT CGATAAAGAC 
ATCAGCCAGA GCAATCCCTC GGGCTTGGTC GCCCTTGCCC TCGATGGTTT TAGATTTGAT 
ATCAACGGCA AAAAAGCCCA AATCGAAACC GCGATGATCC CAGTGCGCTT CGAGGATTTT 
GATCAAGGCA TTATCGAGTC GCTACTTAGC CCGATTTACC GCGATCCTAA AACCCAGTTT 
GTCTTTACCG TCAGCATGGG CCGCAGTGAC TTTGATATTG AACGCTTCCC CGGCCGTAAC 
CGTAGCGCCG CCGCGCCGGA TAACCAAAAT CTGTACACAG GCGGAAGCAA AACCGCGCCT 
GTCGCCCCCA AACTCAATGG TAAAGACTTT ATCGGCCCAG AGTTTGTTGA GTTTTCACTG 
CCCGTTGCCG CCATGCAGGT CAAAGACGGC CAATGGAAAG TCAACGACAA CCATACAGTG 
ACCACACTAG CGCGCGGTGA ATTTAATGCC AGCTCCCTAA GCGAGCTGCA AAATGAAACC 
TCGGTCGAAG GTTCTGGTGG TGGCTATCTC TCAAACGAGA TTTCTTATCG CGCCATTGTG 
TTACAGCAAA AGTTCAACAG CCCAGCCAAG GTCGGCCATA TCCACACCCC AAGGGTGAAG 
GGCTACGACA ACGCCACCGA ACAAGCGATT GTCGAGCAAG TGCGTACTAT GGTGATGCAG 
GCCACAGCGA GCCTGTAA

Protein sequence

MLKPSLVFIL ASTVAQTAGA VQLLGDVEVS RIPTAEKTMA EVVYRYQALD EGLATQLSAQ 
KNERDATQLA ARQGHRLWQQ AVRDVQSGHF DDRSLYWARL SMLNSIKSNR ANFKMADWQQ 
NILASAVEKA SRGFSDIQYG DDVQIKIFLT GFDPFFLDKD ISQSNPSGLV ALALDGFRFD 
INGKKAQIET AMIPVRFEDF DQGIIESLLS PIYRDPKTQF VFTVSMGRSD FDIERFPGRN 
RSAAAPDNQN LYTGGSKTAP VAPKLNGKDF IGPEFVEFSL PVAAMQVKDG QWKVNDNHTV 
TTLARGEFNA SSLSELQNET SVEGSGGGYL SNEISYRAIV LQQKFNSPAK VGHIHTPRVK 
GYDNATEQAI VEQVRTMVMQ ATASL