Gene Shewana3_3720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_3720
Symbol
ID	4479921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	-
Start bp	4463658
End bp	4464698
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	49%
IMG OID	639728324
Product	hypothetical protein
Protein accession	YP_871344
Protein GI	117922152
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID	[TIGR00661] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.588173
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATAC TCTACGGAGT TCAAGGCACA GGGAATGGCC ACCTAAGCCG TGCTCGAGTG 
ATGGCAAAAG CCTTAATTGA GCACAATATT CAAGTCGACT TTTTGTTTTC GGGGCGTAAG 
CCTGAACATT TTTTCGATAT GGAGTGTTTT GGGGAGTATC GCGTACAGGC GGGAATGACC 
TTTGCAACCC ACTCTGGGCG GGTGAATGTG CCGCAAACGG TAAGACAAAA TTGCTCTTTG 
TCATTGCTTA AGGATATCCA AGCATTAGAT TTGAGTTGCT ATGACTTAGT GCTGAATGAT 
TTTGAACCCG TATCCGCATG GGCGGCGAGG CGTCAAGGCG TCCCTTCCAT TGGCATAAGT 
CATCAAGCGG CCTTGACGCA TCCAGTGCCT AAGTTGGGAA GCACTTGGTT TAATGAGTTA 
CTACTCAACT ATTTTGCGCC AGTAGATGTG GCACTGGGGT GCCATTGGCA TCATTTTGGT 
TTTCCGATCC TACCTCCCTT TGTTGAAGTC GATGCCAGTC CTATTGAACA TACCCATCAA 
ATTTTGGTGT ATTTACCCTT CGAAGAGGCG GATGCGATCG CCGCATTTTT TAAGCCATTT 
ACGGATTATC AGTTCTTGGT GTATCACGCT AAGCAGCCGA CAACACCGCT TGCCGACCAT 
ATTCAATGGC ATGGTTTTAA TCGTGACGGA TTTAAACAGC ACTTAGCGAG CTGCGGTGGG 
GTGATTGGTA ATGCCGGATT TGAGCTGGCG AGCGAGGCGC TGACCTTAGG GAAAAAGTTG 
TTGGTCAAGC CGCTGATTGG TCAATTTGAA CAGTTGTCGA ATGTGGCTGC GCTCCAATTA 
TTGGGCGCAG GTGACAGTAT GATGAGTCTG GATACGGGCG TGGTCAAACG TTGGCTCAAG 
GCGGCATCGC CAAATCCCAT CACCTATCCA CAGGTGGGCG ATGCCTTAGT GAAATGGATT 
TGCAGCGGTC AGTGGCAACA TACCGCGTCA TTGTGCGATG ACCTTTGGAG TCAAGTGAAG 
CTGCCCGACA CTTGGCGCTA A

Protein sequence

MRILYGVQGT GNGHLSRARV MAKALIEHNI QVDFLFSGRK PEHFFDMECF GEYRVQAGMT 
FATHSGRVNV PQTVRQNCSL SLLKDIQALD LSCYDLVLND FEPVSAWAAR RQGVPSIGIS 
HQAALTHPVP KLGSTWFNEL LLNYFAPVDV ALGCHWHHFG FPILPPFVEV DASPIEHTHQ 
ILVYLPFEEA DAIAAFFKPF TDYQFLVYHA KQPTTPLADH IQWHGFNRDG FKQHLASCGG 
VIGNAGFELA SEALTLGKKL LVKPLIGQFE QLSNVAALQL LGAGDSMMSL DTGVVKRWLK 
AASPNPITYP QVGDALVKWI CSGQWQHTAS LCDDLWSQVK LPDTWR