Gene Shewmr4_1777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1777
Symbol
ID	4252351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2110902
End bp	2111987
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	52%
IMG OID	638118388
Product	hypothetical protein
Protein accession	YP_733908
Protein GI	113970115
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGAG TATTAACGGC TTTCTGGCAA CGCTGGTTGG CAAGGCGCAT GCCGCCCAGT 
TCTGAGTTTG TCCTCAGCCA TCGCAGCATC TTTATTCTGC CCAGTGGCTT TGGTTTAGTC 
TGGCTTGGGC TGGTACTGCT GCTGTATCTG TTTGGCACTA ACTATCAAAA CAATCTTGTA 
ATTGGCCTGA GCATTTTGCT CCTCAGTCTA TTTAATACCT GCATCCTTTA CAGTTATAAA 
AATCTCGCGG GTTTGCGCCT TCGCGCGCTC ACGGCGCCAG AGGTGTATGC GGGCGAAACC 
ATCACCTTTC CAGTCCTGCT CACCTCAAAT CACAGCAGCC ACAATATCAG CTTAAATTAC 
CCCAATAATT TAGCGTACTT ACTCAAACAG GTTGGCGCCG ATGAGGTGCA AGCTCTGGTC 
TCGTTTGCCC ATGACAGCCG TGGTCTGGTA TCGCCTGGCC GACTTAAGAT TGAATCCTTT 
TATCCCTTAG GGCTTTGCCG CGCTTGGTCC CATATTGATC TCGATAATGC GCACATCGTC 
TACGCCCACC CGATTGAAAG CCCTTTGCAG CTAAAGGCGG CGACCGAATC CGGTGAAGAC 
GAACGGTTAG AACGAGCAGG AAAGTACATC GCCGGCATCG ATGAATACAA AGGGCTTAAG 
CCCCATGTGC TCGGTGAATC TCTTAAACAA GTGGCATGGA AACAATGGGC TCAAGGGCGT 
GGCATGCTAA CCAAGGAGTT CGAGCAGCCT CAGGGCGATC CCGTATGGTT AACCTTAGTC 
CCCGATCCCG CGCAGCTTGA ACAGCAATTA GGTCAGCTCA GCTGGCAAGT CAACCATTTG 
AGTCAGCAGG AGCAATATTT TGGTCTGTGG CTGCAGCGTG TTGGGGCGGA AGATCTGATC 
CTCACACCCG ATATGGGCAA TGCCCATCGT ATCGCCTGCC AAAGGGCGCT CGCAATTTAC 
GGGCAAGATA TCAGCACGCT GGATAAAACC GATAAATTGA TGAATAACCA AGGTGTTAAG 
CATCAGCATC CGCTTCCTCC CCATGGGCAA GGCGTGCGTT CTGCAACAAT GGAGCCGCGG 
CGATGA

Protein sequence

MKRVLTAFWQ RWLARRMPPS SEFVLSHRSI FILPSGFGLV WLGLVLLLYL FGTNYQNNLV 
IGLSILLLSL FNTCILYSYK NLAGLRLRAL TAPEVYAGET ITFPVLLTSN HSSHNISLNY 
PNNLAYLLKQ VGADEVQALV SFAHDSRGLV SPGRLKIESF YPLGLCRAWS HIDLDNAHIV 
YAHPIESPLQ LKAATESGED ERLERAGKYI AGIDEYKGLK PHVLGESLKQ VAWKQWAQGR 
GMLTKEFEQP QGDPVWLTLV PDPAQLEQQL GQLSWQVNHL SQQEQYFGLW LQRVGAEDLI 
LTPDMGNAHR IACQRALAIY GQDISTLDKT DKLMNNQGVK HQHPLPPHGQ GVRSATMEPR 
R