Gene Shewmr4_0100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_0100
Symbol
ID	4250979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	110959
End bp	112500
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	54%
IMG OID	638116642
Product	histidine ammonia-lyase
Protein accession	YP_732238
Protein GI	113968445
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCAG TCAATCATTT AGTATTAACG CCCGGCAGTT TAAGTCTGGC GCAATTGCGT 
GAAATCAGCC GCCATAAGCT GACACTCGAA CTGGCGCCAG AGGCGATAAA CGATATCAAC 
ACCAGCGCGC AAATCGTGCA AAAGGTGTTG GATGAAGGTC GCACCGTTTA CGGCATCAAC 
ACGGGTTTTG GTCTGCTGGC CAACACTAAG ATTGCCCCGG AAGATCTGCA ATTACTGCAA 
CGCTCTATCG TGTTATCCCA CGCTGCGGGC ACGGGCCAAT ACATGCAGGA CGCGACCGTG 
CGCCTGATGA TGGTGTTAAA GATCAACTCC TTAAGCCGTG GCTTCTCGGG TATCCGTTTA 
GAAGTGATTA ATTTCCTTAT CAGCCTAGTG AACGCCGAGG TTTATCCTTG TGTGCCTGAA 
AAAGGTTCTG TGGGCGCCTC TGGCGACTTA GCGCCGTTAG CCCATATGTG TTTGCCGCTG 
TTGGGTGAAG GCGAGATGAG CTATCAAGGT CAGATTATTT CGGCCGCCGA AGGCTTAGAA 
ATCGCCGGCC TCAAGCCTAT CGATTTAGCC GCGAAGGAAG GCTTAGCCCT GCTCAACGGT 
ACTCAGGCTT CTACTGCTCT GGCGTTGGAA GGTCTGTTCC ACGCTGAAGA CTTGTTTGCT 
GCAAGCTCAG TGATTGGCGC CATGAGCGTC GAGGCAGCCA TGGGTAGTCG CAGTCCGTTT 
GACCCACGCA TCCATGCGGC TCGTGGTCAG AAAGGACAAA TCGATGCGGC CATGGTGTTC 
CGTCATCTGT TGGGCGAAGA GTCTGAAATC AGCTTAAGCC ACATCAACTG CGAGAAGGTG 
CAAGATCCTT ACTCACTGCG CTGCCAACCA CAGGTATTAG GTGCGTGCTT GACCCAAATC 
CGCCAAGCGG CCGAGGTGTT AGGCACAGAA GCCAACGGTG TGACCGATAA CCCGCTGGTA 
TTTCAAGATA CTGGCGATAT TATCTCCGGT GGTAACTTCC ACGCCGAGCC CGTTGCTATG 
GCAGCCGATA ATTTGGCGAT TGCGATTGCC GAATTAGGCG CGATTGCAGA GCGTCGTATC 
GCGCTGCTTA TCGACTCTAG CCTATCTAAA CTGCCACCTT TCCTGGTTAA AAATGGCGGG 
GTGAACTCGG GCTTTATGAT CGCCCAAGTG ACGGCGGCGG CATTGGCCTC TGAAAACAAA 
ACCTACGCCC ATCCAGCATC GGTCGACAGT TTACCGACCT CGGCCAACCA AGAAGACCAT 
GTGTCTATGG CGACCTTTGC GGCGCGCCGT TTACGGGATA TGAGCGAAAA CACCCGTGGC 
GTGTTAGCTG TTGAGTTATT GGCGGCCGCC CAAGGCTTGG ATTTCCGCGC GCCATTAATG 
CCAAGCAAAG CAGTGGCGCA GGCGAAGGCC GAGCTACGCG AAGTGGTTGC CTACTATGAT 
AAAGACAGAT ACTTTGCGCC GGATATCGAT GCGGCAACGG ATCTGCTTTA TACCGCCAGC 
TTCAATGCTT ACTTGCCCCA AGGCGTATTG CCGAGTCTGT AA

Protein sequence

MKSVNHLVLT PGSLSLAQLR EISRHKLTLE LAPEAINDIN TSAQIVQKVL DEGRTVYGIN 
TGFGLLANTK IAPEDLQLLQ RSIVLSHAAG TGQYMQDATV RLMMVLKINS LSRGFSGIRL 
EVINFLISLV NAEVYPCVPE KGSVGASGDL APLAHMCLPL LGEGEMSYQG QIISAAEGLE 
IAGLKPIDLA AKEGLALLNG TQASTALALE GLFHAEDLFA ASSVIGAMSV EAAMGSRSPF 
DPRIHAARGQ KGQIDAAMVF RHLLGEESEI SLSHINCEKV QDPYSLRCQP QVLGACLTQI 
RQAAEVLGTE ANGVTDNPLV FQDTGDIISG GNFHAEPVAM AADNLAIAIA ELGAIAERRI 
ALLIDSSLSK LPPFLVKNGG VNSGFMIAQV TAAALASENK TYAHPASVDS LPTSANQEDH 
VSMATFAARR LRDMSENTRG VLAVELLAAA QGLDFRAPLM PSKAVAQAKA ELREVVAYYD 
KDRYFAPDID AATDLLYTAS FNAYLPQGVL PSL