Gene Coch_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Coch_1047
Symbol
ID	8367469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Capnocytophaga ochracea DSM 7271
Kingdom	Bacteria
Replicon accession	NC_013162
Strand	+
Start bp	1245530
End bp	1247038
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	46%
IMG OID	644983475
Product	Histidine ammonia-lyase
Protein accession	YP_003141163
Protein GI	256819884
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACAT TGCGTACTTA CAGCGATTTT AAAGATATCG TTTTTGATAA GAAAGAAGTG 
GCTATTAGCA AAGAAACTAA AGCCCTCATT GAAGAGAGTT ACGCTTTCTT AAAAGACTTT 
GCAGAGAACA AAATCATCTA TGGCGTGAAT ACGGGCTTTG GACCGATGGC GCAATATCGC 
ATTGAAAAAG AAGACCAATT GCAGTTGCAA TACAACCTTA TCCGCAGTCA TAGTTCGGGC 
TTAGGGGAGG TGTTTGATGA AGAAACCGTG CGGGCGGCTA TATTGTGTAG ACTTACGAGC 
TTGTCGTTAG GCAAATCGGG GGTGCATATA GAGGCAATTG AACTGATGCG CGACCTATTG 
AACTACCGCA TTACCCCGCT TATTTTCCAA CACGGAGGCG TGGGAGCTAG TGGCGACCTT 
GTGCAGTTAG CCCATCTCGC CTTAGTGCTC ATAGGCGAAG GAGAAGTGTT CTACAAAGGC 
GCGCGCAGAC CTACGGCTGA AGTATTTGCC GAAGTGGGAC TCAAACCGCT ACAAATACAC 
TTACGCGAGG GTCTTTCGCT GATGAACGGC ACGTCGGTAA TGACGGGCTT GGCAGGGGTG 
AATGTGTATT ACGCACAAAA GCTATTGGAT TGGACAGTGA AGTTCACAAC GGCTATCAAC 
GAGCTAGTAC AGACTTATGA CGACCATTTT TCATCTGAAT TAAACAACGC CAAACAACAT 
ACTGGGCAAA AAGAAATCGC CCGAATGATG CGCGACTTCT TGCACGACAG CAAGCGCACC 
CGCAAACGTG CAGAACATCT TTACAAAGGG CAGCACAACG AAACTGTATT TAAAGAAAAG 
GTGCAAGAAT ACTACTCCTT GCGCTGTGTG CCACAGATAC TCGGGGCTGT ATACGACACC 
ATTGCGCATA CTGAGCGCAT CGTAGAAGAG GAACTGAACT CGGCTAACGA CAACCCAATA 
GTAGATGTGC CTACCCAACA GGTATATCAC GGGGGTAACT TCCACGGCGA TTATATATCT 
CTTGAAATGG ACAAGCTTAA ACTGGTAGTT ACCCGTATGA CAATGCTTGC TGAGCGACAG 
CTCAACTACC TTTTGAACCC CAAAATCAAC GAGCTATTGC CACCATTTGT GAACGCAGGG 
AAATTGGGCT TTAACTTCGG TATGCAAGGG GTACAGTTTA CCGCTACTTC TACCACTGCC 
GAAAACCAAA CCCTCTCTAC CTCGATGTAT GTGCATAGTA TCCCGAACAA TAACGATAAT 
CAGGATATAG TGAGTATGGG TACCAATGCG GCGACTCTTA CCCATAAAGT GATAAACAAC 
GCTTTTCAGG TGCTTGCTAT TGAGGCTATC ACCATTGCGC AGGCTATCGA TATCTTGGGC 
TGTTATGACG AGCTTTCGAG CACTACAAAA GAATGGTATA GGGAAATAAG AGAGATTATA 
CCGTTCTTTA AGGAAGATTT GGTGTTTTAT GCTTACTTGA AGGAAGCCAC ATCGTGGTTA 
AAGAAATAG

Protein sequence

MKTLRTYSDF KDIVFDKKEV AISKETKALI EESYAFLKDF AENKIIYGVN TGFGPMAQYR 
IEKEDQLQLQ YNLIRSHSSG LGEVFDEETV RAAILCRLTS LSLGKSGVHI EAIELMRDLL 
NYRITPLIFQ HGGVGASGDL VQLAHLALVL IGEGEVFYKG ARRPTAEVFA EVGLKPLQIH 
LREGLSLMNG TSVMTGLAGV NVYYAQKLLD WTVKFTTAIN ELVQTYDDHF SSELNNAKQH 
TGQKEIARMM RDFLHDSKRT RKRAEHLYKG QHNETVFKEK VQEYYSLRCV PQILGAVYDT 
IAHTERIVEE ELNSANDNPI VDVPTQQVYH GGNFHGDYIS LEMDKLKLVV TRMTMLAERQ 
LNYLLNPKIN ELLPPFVNAG KLGFNFGMQG VQFTATSTTA ENQTLSTSMY VHSIPNNNDN 
QDIVSMGTNA ATLTHKVINN AFQVLAIEAI TIAQAIDILG CYDELSSTTK EWYREIREII 
PFFKEDLVFY AYLKEATSWL KK