Gene Paes_0225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_0225
Symbol
ID	6459699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	234548
End bp	235891
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	52%
IMG OID	642724216
Product	pentapeptide repeat protein
Protein accession	YP_002014929
Protein GI	194333069
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA TTCTTCTTCC TGCAACAATA GTCATGCTTT GCCAGTTTGG CCCCGCCTCT 
GTAAACGGGT ATTGCGCCAA CCAGGCACAG GTCAACCAGT TACGCTCCGA TGTCGCGACA 
TGGAACAGCT TGCGCAGTAA GGGCTCCGAA CCGGTCATAG ACCTCAATTA TGCAAAACTG 
AACGATGCCA ACCTCAACGA TGCGGATCTG CACGATGCGT CGATGATCAA AGCCGGGCTC 
AACGGAGCCG CTATCAACCG CTCAAATCTG AAGAACGCAA ACCTTTATCT GGCAAAGCTC 
AAACGCGCAA ACATCAAAGA TGCCTCTCTC GAAGGAGCAA ATCTCGTAAA AACGGATATG 
AGAAGCGCCT GCATGTCGCG CACAAACCTA CGATCGGCAA ATCTTGCCAT GGCCGACTTG 
CGCTGGGTCA TTCTCGATGA GGTGAACCTC AATAGCGCGT TCCTGGAAAA AGCGAAACTG 
TTCGGGGCAA CACTCAAAAG TGCAGACCTG AGAGGTGCTA ATCTGAAAGG AGTAGAAATG 
CTCGGACAAG CCAACCTCAC AGGAGCAAAG GTTTCCGTAA ATACTATTTT GCCAAATGGG 
AAGCGCGCAA CATCGCTCTG GGCATCCATA CACGGAGCCC GATTCATCAA AGAACCCGAA 
ACTCCGGCTG TTGTCATGGA CTACTCAGAG ATCAGCCTTC CTGAAATAAA CACGGTCGGA 
ATTCCAGAAA AACCGAACGA TTCCACCACT CCCGGCCCCC CTGCACTCAA GCCGCAAATC 
ATACTGGAGC AGGATGTTCA GGCATGGAAT GCCATGCGCA CGCAGCAACC GGAACTCAAG 
CCGGACATGG AAGAAGAAGA CCTCAGCGAT GCCCGCCTTG AGGGAGCCGA CCTGAAAGCC 
CTTGCAATGA ACAATGCGAC AATGGACGGA GCCGATATGG ATAGTGCGGA CTTTTCAGGC 
TCCCAGCTTG CAAACACCTC ATGGAAAAGA GCTGATCTGA AAAACGCAAA CTTCCAGAAC 
GCCGATCTGA CAGGCGCAAA CTTCGAAAAT GCCTTCATGA GAGGAGCAAA TCTCTCGAAC 
GCCAATCTCA CAGGAGCGCG TTTCTATGGA ACAAGGGTTC AGGACGCCAA CATGCAGAAT 
GCCGATATGC AGAAGGTCAA TCTCTTCAAC GCCGATCTGA CAGGCGCCAA CCTCTGCGGA 
GCCAATCTGA AAAACGCACA GCTTATGGAT ACCATCCTCA ACGGGGCACA CATCTCAACA 
TCGACAATCA CCCCTTCGGG AAAACCCGCC ACACGAAGCT GGGCTGTACT TCGTGGGGCT 
CGATTCACTG ACAACAAAGA GTAA

Protein sequence

MKKILLPATI VMLCQFGPAS VNGYCANQAQ VNQLRSDVAT WNSLRSKGSE PVIDLNYAKL 
NDANLNDADL HDASMIKAGL NGAAINRSNL KNANLYLAKL KRANIKDASL EGANLVKTDM 
RSACMSRTNL RSANLAMADL RWVILDEVNL NSAFLEKAKL FGATLKSADL RGANLKGVEM 
LGQANLTGAK VSVNTILPNG KRATSLWASI HGARFIKEPE TPAVVMDYSE ISLPEINTVG 
IPEKPNDSTT PGPPALKPQI ILEQDVQAWN AMRTQQPELK PDMEEEDLSD ARLEGADLKA 
LAMNNATMDG ADMDSADFSG SQLANTSWKR ADLKNANFQN ADLTGANFEN AFMRGANLSN 
ANLTGARFYG TRVQDANMQN ADMQKVNLFN ADLTGANLCG ANLKNAQLMD TILNGAHIST 
STITPSGKPA TRSWAVLRGA RFTDNKE