Gene Tery_4599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4599
Symbol
ID	4246253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	7072002
End bp	7073312
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	35%
IMG OID	638109472
Product	aminopeptidase P
Protein accession	YP_724048
Protein GI	113477987
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATTT CAACAGAATA TAAACAACGA CGCAAACAAT TAATAACAAA AATTGGCAAT 
GGTACGGCTA TATTTAGAAG TGCGCCAATG GCTGTAATGC ACAATGATGT AGAATATGCT 
TATCGTCAAG ATAGCGATTT TTTTTATTTA ACAGGTTTTA ATGAACCGGA AGCTGTGGCA 
GTTATTGCAC CACACCATGA AAAGCATAAA TTTGTTCTGT TTGTACAACC AAAAGACCAA 
TTAAAAGAAA CTTGGACTGG TTATCGTGCT GGAGTGGAAG TTGCTAAGGA AAAGTATGGT 
GCTGATGCAG CTTTTTCTAT TAATGAACTG AATAAAAAGT TGCCTGAATA TTTGAAAAAG 
GCTGATAAAA TTTATTATCG TTTGGGACGC GATCGCAACT TTAATGAAAC AGTATTTAAA 
CATTGGCAAA ATTTAATGCG AGTCTATCCG AAATCTGGCA CTGGTCCAAT AGCAATTCAA 
GATGCAGGGA CAATTTTACA CCCAATGCGT CTTGTTAAAA GTGCTAAGGA ATTAGAACAA 
ATGCAAAAAG CTGCTGATAT TGCTGTTAAT GCTCATAATT ATGCGCTCAA GTTTGCTCAA 
GCAGGTCAGT TTGAATATCA AATTCAAGCG GAAATGGAGT ATATATTTTC TCGTCATGGA 
GCTACTCCTG CTTATCCTTC TATTGTTGCT TCTGGTGCTA ATTCTTGCAT TCTTCATTAT 
ATAGAAAATA ATCGACAAAT GCAAGAAAAT GATTTGTTAT TAATTGATGC TGGAGCTGCT 
TACAATTATT ATAATTCTGA TATTACTCGA ACTTTTCCCA TAAGTGGGAA ATTTACCCCA 
GAACAAAAGA TTATTTATGA GTTAGTTTTA AGGGCACAGT TAGCGGCAAT TGAACAAGTA 
AAACCAGGAA ATCCTTATAA GCAAATTCAC GAGACAGCAG TGCGAGTTTT AGTGGAAGGA 
TTGATAGATT TAGGAATGTT AAAAGGTAAT ATTGATGAAA TAATTGAAAA GGAAAAATAT 
AGGCCTTTTT ATATGCATAA AACCGGACAT TGGTTGGGTT TAGATGTTCA TGATGTAGGT 
GTTTATCAGT GGGGAGAAGA ACCTCAAATT TTACAACCAG GACAAGTTTT GACTGTGGAA 
CCTGGTATTT ATATTGGTCT TAATATTAAA CCTGCTGAAG GTCAACCGGA AATATATGAT 
CGTTGGCGTG GAATTGGAGT AAGAATTGAG GATGATGTTT TGGTTACTGC AGAAGGATGT 
GAAGTATTAA CTGCGGGAGT GCCTAAGTTA GTTGAGGATT TAGAAAGTTA A

Protein sequence

MAISTEYKQR RKQLITKIGN GTAIFRSAPM AVMHNDVEYA YRQDSDFFYL TGFNEPEAVA 
VIAPHHEKHK FVLFVQPKDQ LKETWTGYRA GVEVAKEKYG ADAAFSINEL NKKLPEYLKK 
ADKIYYRLGR DRNFNETVFK HWQNLMRVYP KSGTGPIAIQ DAGTILHPMR LVKSAKELEQ 
MQKAADIAVN AHNYALKFAQ AGQFEYQIQA EMEYIFSRHG ATPAYPSIVA SGANSCILHY 
IENNRQMQEN DLLLIDAGAA YNYYNSDITR TFPISGKFTP EQKIIYELVL RAQLAAIEQV 
KPGNPYKQIH ETAVRVLVEG LIDLGMLKGN IDEIIEKEKY RPFYMHKTGH WLGLDVHDVG 
VYQWGEEPQI LQPGQVLTVE PGIYIGLNIK PAEGQPEIYD RWRGIGVRIE DDVLVTAEGC 
EVLTAGVPKL VEDLES