Gene Ppha_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ppha_2039
Symbol
ID	6462865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelodictyon phaeoclathratiforme BU-1
Kingdom	Bacteria
Replicon accession	NC_011060
Strand	+
Start bp	2131061
End bp	2132263
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	49%
IMG OID	642728234
Product	protein of unknown function DUF1016
Protein accession	YP_002018864
Protein GI	194337070
COG category	[S] Function unknown
COG ID	[COG4804] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.454734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTATA AACAGTTACT TGCCCTCTTC AAAGAGACCC ATCAGGAGTT ACAGCAAAGA 
GCCGCCCGCT CGGTCGATAC CTCCCTGGTG ATCCGGAACT GGCTGTTCGG GTGGTACATT 
GTAGAGTTTG AGCAGGGCGG CTCAGACAGA GCGGAGTATG GCGCCAATTT GCTAAAAAAA 
ATCGCGGCTC AGTTGACGAT CAAAGGCTGT TCAGAACGAA GCCTCGCGCT CTGCTGTAAG 
TTCTATCTCA CCTATTCTGG AATTTTGCAG GCACTGCCTG CAAAATCTGA AAGCAGGCAG 
AATGAGTTCC AAAAGATTGG GCAGACACTG CCTGACCAAT CTTTTCGTGA GCAAAGTGAA 
CTACCGGAGA TTCAACAGGC ACTGCCTGTT ACATCTTTTG ATGCCATAGC CAGTGCTCCC 
AAAATGGTTC AGGAACTCTC CGAAACATTG GCTGGCTGCT TTTCTCTCGG ATGGACACAT 
TACGTTGCTT TGCTGACCAT ATCGAACACT GATGAGCGCC GATTCTACGA AATTGAAGCC 
AGCGAAAACA GTTGGGGTGC CCGAGAGCTT GAGCGGCAGA TAGCGGCCTC GCTGTATGAG 
CGGCTGGCAC TCAGTCGTGA CAAGGAGGGA ATCCGGCAGC TCTCAGAGAA GGGGCTGATT 
ATTGAAAAAC CGGCGGATGT GATCAAAAGC CCCTTTGTGC TTGAGTTTCT GGATCTGGAA 
GAAAAAACCG CTTATTCGGA ACATGCACTT GAAACGGCCA TTATCGACCA CCTCGAACAC 
TTTCTGCTTG AACTGGGCAA AGGGTTTCTC TTTGAGGCTC GCCAGAAACG GTTCACCTTC 
GATAACGACC ACTTTTATGT TGATCTGGTT TTTTATAATC GGCTCTTGCG CTGCTATGTG 
CTTATTGACC TCAAGCGCGA CAAGCTGACG CATCAGGATC TTGGGCAGAT GCAGATGTAT 
GTGAACTACT TTGACCGCTA TGTCAAAACG GAGGATGAAC TGCCGACCAT TGGCATTCTG 
TTGTGCCATC GCAAGCATGA TGCGCTGGTT GAACTGACAC TCCCCAAGGA TTCAAATATT 
TTTGCATCAA AGTATCAGCT CTATCTGCCC TCAAAAGAGG AGCTGAAAAG GCAACTGGAA 
GAGGCTGCAG GCATTGGGCA CTGCGAAAAT CCCGATCAGG AGGGAATGAA CGATGTTCGA 
TAA

Protein sequence

MNYKQLLALF KETHQELQQR AARSVDTSLV IRNWLFGWYI VEFEQGGSDR AEYGANLLKK 
IAAQLTIKGC SERSLALCCK FYLTYSGILQ ALPAKSESRQ NEFQKIGQTL PDQSFREQSE 
LPEIQQALPV TSFDAIASAP KMVQELSETL AGCFSLGWTH YVALLTISNT DERRFYEIEA 
SENSWGAREL ERQIAASLYE RLALSRDKEG IRQLSEKGLI IEKPADVIKS PFVLEFLDLE 
EKTAYSEHAL ETAIIDHLEH FLLELGKGFL FEARQKRFTF DNDHFYVDLV FYNRLLRCYV 
LIDLKRDKLT HQDLGQMQMY VNYFDRYVKT EDELPTIGIL LCHRKHDALV ELTLPKDSNI 
FASKYQLYLP SKEELKRQLE EAAGIGHCEN PDQEGMNDVR