Gene Shewmr4_1798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_1798
Symbol
ID	4252372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	2133719
End bp	2134909
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	53%
IMG OID	638118409
Product	histidinol-phosphate aminotransferase
Protein accession	YP_733929
Protein GI	113970136
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAG TGCCAACTAG CCAAGCACCA ACGAGCAATG TGCCTGTGAC AAATATTCCG 
AGCGCCAATT GCGCCAGCAA TACTCTCGAC AACAATACTC TCGATAACAC AAGCATCGAG 
CCAACAACCC TTGCCGCCCG TCTTGCGCGG CCCGAGCTGC TCGAGTTAAC GCCTTACCAA 
AGTGCTCGCA GGCTGGGTGG TCGTGGGGAT ATTTGGATCA ACGCTAACGA ATCGCCCTTC 
AATAATGTGG CCGTTGCCGA ACTCGATTTA TCTAAGTTAA ATCGTTACCC CGAGTGCCAA 
CCGCCCGCGT TAATCAATGC CTATAGCCAA TATAGCGGTG TTGCGGAGAG CAAAATTGTC 
GCCAGCCGCG GCGCCGATGA GGCCATCGAG CTACTTATTC GTGCTTTTTG TATCCCAGGT 
ATCGACTCAA TTGCCACCTT TGGGCCCACT TACGGCATGT ACGCCATTAG CGCGCAAACC 
TTTAATGTGG GCGTTAAGGC ATTAAGCTTA ACGGCGGAGT ACTGTCTCCC AAGTGACTTT 
GCGACGGCCG CGCGCGGCGC TAAGTTAGTG TTTATCTGTA ATCCCAATAA CCCAACTGGC 
ACTGTGATTG AGAAGGCGCG CATAGAGCAA GCCATCCAAG CCCTGCCCGA CGCCATTGTT 
GTTGTCGATG AGGCTTATAT CGAGTTTTGC CCCGAATATA GCGTCGCCGA TTTACTCGAG 
TCTTACCCAA ACCTTGTGGT GCTACGCACT CTTTCAAAGG CCTTTGCCTT AGCGGGCGCG 
CGCTGCGGCT TTTTGCTCGC CAATGAAGAG ATTATCGAAA TCATCATGCG GGTGATTGCG 
CCCTATCCTG TGCCATTGCC CGTGAGTGAA GTGGCCGTGC AAGCACTATC AGCTGCTGGG 
ATTGCGCGGA TGAAAACCCA AGTCAAAGCG CTCAATGCTC AGGGCGAGCG ACTCGCGGCG 
GCGCTGAATT TGTACTGCGA ACAATGGGGC GGCGCCGTGC TAACACCCAA TGGCAACTAT 
GTACTCGCCG AATTCGACGA TGTGGCAAAA GTGGCACAGC TGCTTATCGA CAATGGCATT 
GTCGCGCGGG CCTATAAGGA CCCTAGATTG GCTAAAGCCA TTCGTTTTAG CTTTAGCTCT 
GAGGCTGACA CCGACCGCTT AGTGTCGCTA TTTGAATCGC AAAAGCTGTG A

Protein sequence

MSQVPTSQAP TSNVPVTNIP SANCASNTLD NNTLDNTSIE PTTLAARLAR PELLELTPYQ 
SARRLGGRGD IWINANESPF NNVAVAELDL SKLNRYPECQ PPALINAYSQ YSGVAESKIV 
ASRGADEAIE LLIRAFCIPG IDSIATFGPT YGMYAISAQT FNVGVKALSL TAEYCLPSDF 
ATAARGAKLV FICNPNNPTG TVIEKARIEQ AIQALPDAIV VVDEAYIEFC PEYSVADLLE 
SYPNLVVLRT LSKAFALAGA RCGFLLANEE IIEIIMRVIA PYPVPLPVSE VAVQALSAAG 
IARMKTQVKA LNAQGERLAA ALNLYCEQWG GAVLTPNGNY VLAEFDDVAK VAQLLIDNGI 
VARAYKDPRL AKAIRFSFSS EADTDRLVSL FESQKL