Gene Shewana3_0335 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_0335
Symbol
ID	4479071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	-
Start bp	370271
End bp	371836
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	54%
IMG OID	639724867
Product	histidine ammonia-lyase
Protein accession	YP_867984
Protein GI	117918792
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase [TIGR01226] phenylalanine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACG CAGTTACTCA CACGACAACC ACTGAGCAGC CAATCGAATT TGGCCGTCAG 
TTACTCACAT TAGAGCAAGT CGTCGCCGTT GCTAAGGGTG CTAAAGTCAA ACTCTGTGAT 
GATGCCGATT ACCAAGCTTA TATCCAAAAG GGCGCCCGCT TTATCGACAG CCTGCTACAC 
GAAGAAGGTG TGGTCTACGG CGTCACCACC GGCTATGGCG ACTCTTGCAC TGTCAACGTG 
AGTCTCGACT TAGTCCATGA GCTGCCACTG CACTTATCCC GCTTCCATGG CTGTGGCCTC 
GGCGAAGTCT TGAGCGTGAT GCAGGCGCGC GCCGTGATGG CTTGCCGTTT AAACTCACTC 
GCCATCGGTA AATCCGGCGT AACCTATGAG TTATTAAAAC GCATCGAAAC CTTGCTTAAT 
CTCAATATAG TGCCGGTGAT CCCAGAGGAA GGTTCGGTCG GTGCCAGCGG TGACTTAACG 
CCACTGTCTT ACTTGGCCGC CGCGCTAGTT GGCGAGCGCG AAGTGATTTA TAACGGCGAG 
CGCAGAGCCA CCCAAGAGGT TTACCGTGAG CTGAACATCA CGCCCCATGT GCTGCGCCCC 
AAGGAAGGTT TAGCCCTGAT GAATGGCACG GCAGTGATGA CGGCATTAGC CTGTTTAGCC 
TTTGATCGCG CACAATATTT AGCGCGTTTA GCCAGCCGCA TTACCGCCAT GGCATCGTTA 
ACCCTCAAAG GTAACTCGAA CCATTTCGAC GATATTCTGT TTGCCGCCAA ACCCCATCCG 
GGACAAAACC AAATCGCGAC CTGGATTAGG GAAGATTTGA ACCACCATGT TCACCCGCGC 
AATTCCGACA GATTGCAGGA CAGATATTCC ATCCGCTGCG CGCCGCACAT CATTGGCGTA 
TTGCAGGATG CACTGCCCTT TATGCGCCAA TTTATCGAAA CCGAAGTCAA CAGCGCCAAC 
GACAACCCCA TAGTCGATGG TGAAGGCGAG CATATTCTCC ACGGCGGCCA TTTTTACGGT 
GGACACATTG CCTTTGCGAT GGATTCCTTA AAAAACACTG TGGCCAACAT CGCCGATCTT 
ATCGACCGCC AAATGGCACT AGTGATGGAT CCTAAGTTTA ACAACGGTTT ACCCGCTAAC 
CTTTCGGGTT CTACTGGCGC GCGCCGTGCC ATCAACCATG GCTTTAAGGC GGTACAGATC 
GGGGTTTCGG CATGGACCGC AGAGGCGCTC AAACACACTA TGCCTGCGAG CGTGTTCTCT 
CGCTCAACCG AATGCCATAA CCAAGATAAA GTCAGCATGG GTACTATCGC CGCCCGTGAC 
TGTATGCGCG TGTTGCAGCT GACAGAACAA GTCGCCGCTG CTGCCCTGCT CGCCATGACC 
CAAGGCATTG GTCTGCGCAT CACACAGAAC GAGTTAGACG AAGCTTCGCT GACGCCATCG 
CTGGCCACCA CGCTCGCCCA AGTGCGCGCC GATTTTGAGC CATTAGTCGA AGACAGACCG 
CTCGAAGCCG TACTGCGCCA AACCGTAGCG AAAATCCAAG CGGGCGAATG GGAAGTGTGC 
CGATGA

Protein sequence

MSHAVTHTTT TEQPIEFGRQ LLTLEQVVAV AKGAKVKLCD DADYQAYIQK GARFIDSLLH 
EEGVVYGVTT GYGDSCTVNV SLDLVHELPL HLSRFHGCGL GEVLSVMQAR AVMACRLNSL 
AIGKSGVTYE LLKRIETLLN LNIVPVIPEE GSVGASGDLT PLSYLAAALV GEREVIYNGE 
RRATQEVYRE LNITPHVLRP KEGLALMNGT AVMTALACLA FDRAQYLARL ASRITAMASL 
TLKGNSNHFD DILFAAKPHP GQNQIATWIR EDLNHHVHPR NSDRLQDRYS IRCAPHIIGV 
LQDALPFMRQ FIETEVNSAN DNPIVDGEGE HILHGGHFYG GHIAFAMDSL KNTVANIADL 
IDRQMALVMD PKFNNGLPAN LSGSTGARRA INHGFKAVQI GVSAWTAEAL KHTMPASVFS 
RSTECHNQDK VSMGTIAARD CMRVLQLTEQ VAAAALLAMT QGIGLRITQN ELDEASLTPS 
LATTLAQVRA DFEPLVEDRP LEAVLRQTVA KIQAGEWEVC R