Gene Spea_3920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spea_3920
Symbol
ID	5664304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella pealeana ATCC 700345
Kingdom	Bacteria
Replicon accession	NC_009901
Strand	-
Start bp	4768626
End bp	4769636
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	48%
IMG OID	641238584
Product	BNR repeat-containing glycosyl hydrolase
Protein accession	YP_001503765
Protein GI	157963731
COG category	[R] General function prediction only
COG ID	[COG4447] Uncharacterized protein related to plant photosystem II stability/assembly factor
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAT TCATGCTGTT AATAAGCTTA TTTAGTTTTG CTACTGTGGC GATGGAATGG 
AATATTCAAA GCCTAGCCCC CGGTGTTTCA TTTCGAGGTA GCGCAGTTTT GGATGGCGTG 
GTTTGGGTGA CTGGGACAGA TAATCGCGTC TATATCTCTA AAGATTCAGG TAACAGCTGG 
CAAGATGTAT CGGTAAAGGG GCTGCCTTTG ACTGACTTTC GCGATATTGA AGTGTTCGAT 
GCCAATACGG CGATTGTGAT GGGAGCGGGT GAAGGTGGCT TATCTAAGCT GTATATCACT 
CAGAACCAGG GTCTAAGCTG GCAACTCTTG TTTGATAATC CCGATGAGCT TGGCTTTTTC 
AACTCAATTG CCTTTTGGGA TCGTAATAAC GGGTTACTGC TGGGAGATCC TGTTGGTGGT 
TGCTATGTGA TATTACGTAC CTCTGATGGT GGTAAAAGCT GGCAACGAGT TGCCCAAGGT 
GAGTTGCCTG AAATGCTCGA TAAAGAGGTC GCCTTTGCCG CCAGTGGTAA TACATTAATT 
GTTGGCAAAA GAGGGCGGGC TTGGTTTACC ACCGGAGGCT ATAGTAGCTC AGCTTATAGT 
AGCGCTGACT CGGGGCAGCA CTGGCGCCGG CGTCCAATTG CTCTCTATGA TGATACCCAA 
ACCGCAGGTG GCTATGCGCT AGCATTTAAT CATTTAGGTG ATCTATTTGT GCTGGGAGGA 
GATTATCAGC AACGAGATAA GTTTGATGCC AATATGGTCT ACAGGAAAGG CTATGTATGG 
CATAAAGCGC CGGGTACCAC ACCAGGCCTA CGCACAGCCA TGGCGTGTTA CCAAGAGATT 
TGCATCGCGA CCGGTAAGCT ATCGTCAGAT ATTTCAATCG ATCATGGTTA CAGTTGGCAG 
CCACTGTTGA TCAATGGTCA GGCTCAGGGC TTTTTTACGC TCGCGATTGA CGGTAACACC 
TTAGTGGCTG GTGGGCATGA TGGCCGAGTC GCCGTGTATA CTTTTGAATA G

Protein sequence

MKIFMLLISL FSFATVAMEW NIQSLAPGVS FRGSAVLDGV VWVTGTDNRV YISKDSGNSW 
QDVSVKGLPL TDFRDIEVFD ANTAIVMGAG EGGLSKLYIT QNQGLSWQLL FDNPDELGFF 
NSIAFWDRNN GLLLGDPVGG CYVILRTSDG GKSWQRVAQG ELPEMLDKEV AFAASGNTLI 
VGKRGRAWFT TGGYSSSAYS SADSGQHWRR RPIALYDDTQ TAGGYALAFN HLGDLFVLGG 
DYQQRDKFDA NMVYRKGYVW HKAPGTTPGL RTAMACYQEI CIATGKLSSD ISIDHGYSWQ 
PLLINGQAQG FFTLAIDGNT LVAGGHDGRV AVYTFE