Gene Haur_4249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4249
Symbol
ID	5736103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5421810
End bp	5423483
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	51%
IMG OID	641281404
Product	peptidase M14 carboxypeptidase A
Protein accession	YP_001547009
Protein GI	159900762
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2866] Predicted carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGAGA TTGATTACAC ACGCTATTAT CGTTTCGCTG AGTTGGTGGA AGCGCTAGAA 
GGCTTTGCCG CCGAATATCC CGATTTGATT AGTTTGCAAT CGATCGGTAA AAGTTATGAA 
GGCCGTGATT TGTGGTTAGC GACCGTTACT AATGTTGCAA CTGGTGGGCC ACGCGAAAAG 
CCAGCCTTTT GGGTTGATGC CAATATCCAT GCGAGCGAAG TAACTGGCGC AATGGCTGGC 
TTACACTTGA TCGATACGCT GCTCAAAGGC TATGGCAACG ATGCTGAATG CACGCGGTTG 
CTTGATCGCA CGACCTTCTA CATTTTGCCA CGCTTCAATC CTGATGGAGC TGAACGGGCC 
TTGACCACGC CCTATGTAGT GCGGTCGAGC GTGCGACCTT ATCCCTATGC TGAACGCATC 
GATGGCTTGT ATCAAGAAGA TATCAACGGC GATGGGATTA TTTTGCAGAT GCGCTTGGTT 
GATCCCAACG GCGATTGGCG GGTCTCCGAG CATGATCCAC GGGTGATGGT CAAGCGCAAG 
CCCTATGAAA TTGGCGGCAC CTACTATCGA ATTTTGCCCG AAGGCTTGAT TCAAAATTAC 
GATGGGGTCA ATATCAAACT GAGCCGCGCA GTCGAAGGCT TGGATATCAA CCGCAACTTT 
CCAGTTGATT GGCGACCTGA AGCCGAGCAA TATGGTGCTG GCCCCTACCC AACCTCTGAG 
CCAGAAATCC GCGCTGTGGT GCAATTTATC GTCGATCACC CCGAAATTCA TAGTGGCCTG 
ACCTACCACA CTTATTCGGG CGTGCTGCTG CGACCATATG GCGACCGCGC CGATGATCAG 
ATGAATTTGC ATGATCTCGA TGTGTTTAAG GCGTTGGGTA AACATGGAAC CGAGTTAACC 
GGTTGGCCCA GTGTTTCGGT TTACCACGAT TTTCGTTACC ACCCCAAAGA TGTGATTACC 
GGGGTGTTTG ATGATTGGGT CTACGATCAC TTGGGTATGT TTGCCTGGAC AGTCGAATTT 
TGGGATTTAG TTGGTTCGGC AGGGATCAAA GATCGCAAAT TTATCGAGTG GTTCAAAGAG 
CACCCCGAAG AAGATGATCT TAAAATTATG CAATGGGTGG ATGAGCATGG CGAGGGCTTG 
TGCTTCTACG ATTGGACAGC CTTCGAACAT CCCCAGCTTG GCCCAGTTGA AATTGGTGGC 
TGGCATCCGA TGTATGCCTT CCGTAACCCA CCGCCAGCCA AATTGCTTGA AACGATTGCG 
CCTGTGACCC AATTTGCCTT AGCTCATGCC GCGATTGCCC CATTCACCAC AATTAGCAGC 
TTTGAGCTTG AGGCGTTGGG CGATAACGTT TATCGGCTGC AAGCAGTGGT GCAAAATGAA 
GGTTATTTAC CAAGTTATGG CTCGCAAAAA GGCCGCGAAC GCAAGGCGAC CTTGCCACTT 
GAAGCCTTGC TCAATCTACC CGAAGGTTCA AGCCTCAAGC TTGGCCAAGC CAAAACCACG 
ATTGGCGATT TGGAAGGGCG TTCAGGCCGA GTTTCATTCT TTGGCTTTAG CAATGGTTCG 
ACCACTGATC GCACCAAAGT CGAGTGGGTG GTGCATGTGC CAAATCCTGG GGTGATTGAA 
TTGACGATCC AAGGTGGACG CGGTGGCATT GCCCGCGCTA AGCTCGAAAT CTAA

Protein sequence

MPEIDYTRYY RFAELVEALE GFAAEYPDLI SLQSIGKSYE GRDLWLATVT NVATGGPREK 
PAFWVDANIH ASEVTGAMAG LHLIDTLLKG YGNDAECTRL LDRTTFYILP RFNPDGAERA 
LTTPYVVRSS VRPYPYAERI DGLYQEDING DGIILQMRLV DPNGDWRVSE HDPRVMVKRK 
PYEIGGTYYR ILPEGLIQNY DGVNIKLSRA VEGLDINRNF PVDWRPEAEQ YGAGPYPTSE 
PEIRAVVQFI VDHPEIHSGL TYHTYSGVLL RPYGDRADDQ MNLHDLDVFK ALGKHGTELT 
GWPSVSVYHD FRYHPKDVIT GVFDDWVYDH LGMFAWTVEF WDLVGSAGIK DRKFIEWFKE 
HPEEDDLKIM QWVDEHGEGL CFYDWTAFEH PQLGPVEIGG WHPMYAFRNP PPAKLLETIA 
PVTQFALAHA AIAPFTTISS FELEALGDNV YRLQAVVQNE GYLPSYGSQK GRERKATLPL 
EALLNLPEGS SLKLGQAKTT IGDLEGRSGR VSFFGFSNGS TTDRTKVEWV VHVPNPGVIE 
LTIQGGRGGI ARAKLEI