Gene Shewmr4_1405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1405
Symbol
ID	4251983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	1636148
End bp	1637116
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	54%
IMG OID	638118004
Product	hypothetical protein
Protein accession	YP_733540
Protein GI	113969747
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0000755973
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAACA GTGTGCTAAA CGCATCCCTA CACAGTGATG GCAATCCACA TGGCTTGCCA 
TTATTTGCCG ACGGGCTGCA TTTAACCGAG AAAGAACTGC TCGCCTGCCA GACGATTGCG 
CGGGCTATTC CTGAGCGTCA CAGCCGGGCA CGTGCCAATA TGGCGGGGCA TCGCAGCAGT 
TTAATCAAAG GCCGCGGGAT GGAATTTGCC GAAGTGCGCC ATTATCAACA GGGCGACGAT 
GTACGCACTA TTGATTGGCG CGTGACCGCC CGCACGGGGC AAACCCATAC TAAGTTATTT 
ATTGAAGAAC GCGAGCGCCC TATTCTGCTG CTGCTCGATT TAAGCCAGAG CCTGTATTTT 
GGCTCGAGTT TGCTGCTGCA GTCGGTACAA GCGGGGCATT TAGCGACCAC GCTAGGTTGG 
AATGCCATCA ATCACGGTGA CAGACTCGGT GCCTTAATCG CCTGCGAGTC GGAGCATCTG 
GAGCTAAAAC CCCGCAGTCG CCGCCAAGGG ATATTGCAGC TCATTTCAGG CCTGCGCCGA 
GTGCACGAGC AACAACTCAA TCAGCTCGGC AGTCATCCAC GGGATCCAGA CCATATCCTG 
CGCGCCTGCC AGCGCTTGCA ACGGATCGCG AAACCGGGCT CATTGATTTG GATCATCACA 
GATGGCAGCC ATTTTACGCC GCAATGTATC GCGCCGCTGA CAGAACTTAA ACGCCATTGT 
GATATTGGCG CTTATCTGGT GACCGACCCT CTAAGGCAGG GCAACCTCAA CTTACCCAAG 
CAGTTTAGTT TGCCTGTTCG CGAAGGGGAC CAAGATTTAG TGCTGACTCG CGACAGTTAT 
CAAGCATGGC TTGGGCAGCA GCAACAGCAG CAAAATGACT TTATCGCCAT GATGCAAAAA 
CTGAAGGTGC GCCCCCAATT TATCGACGCG GGTTTACCCC TCGCACAGCA ATTAGCCTTA 
CTGCAATAA

Protein sequence

MNNSVLNASL HSDGNPHGLP LFADGLHLTE KELLACQTIA RAIPERHSRA RANMAGHRSS 
LIKGRGMEFA EVRHYQQGDD VRTIDWRVTA RTGQTHTKLF IEERERPILL LLDLSQSLYF 
GSSLLLQSVQ AGHLATTLGW NAINHGDRLG ALIACESEHL ELKPRSRRQG ILQLISGLRR 
VHEQQLNQLG SHPRDPDHIL RACQRLQRIA KPGSLIWIIT DGSHFTPQCI APLTELKRHC 
DIGAYLVTDP LRQGNLNLPK QFSLPVREGD QDLVLTRDSY QAWLGQQQQQ QNDFIAMMQK 
LKVRPQFIDA GLPLAQQLAL LQ