Gene Ppha_1220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ppha_1220
Symbol
ID	6463301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pelodictyon phaeoclathratiforme BU-1
Kingdom	Bacteria
Replicon accession	NC_011060
Strand	+
Start bp	1278990
End bp	1280315
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	48%
IMG OID	642727468
Product	pentapeptide repeat protein
Protein accession	YP_002018109
Protein GI	194336315
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAACCG TTGAACTACT TCTCGGATCA GTAACAGAAT GGAACGCAGC TCGAAAGGCA 
CATCAAAAGG GCAGGCCCAA TCTCAAAGGG GCGGATCTCA GCGGGGCACA GCTTAACAAG 
GCAGACCTCA GTCGTACAGA CCTGGTTGGG GCAAACCTCA GAGGGGCAGA CCTCAGCGGG 
GCACAGCTCA ACATGGCAGA CCTCAATAGG GCAGACCTTA ACGGGGCGCA TCTCTATAAT 
GCAAACTTCG GTAAAGCAAA CCTTATCAAG ACAAATCTGA GTAAAGCAAA CCTCAGCGGT 
GCAACCCTAT GGGATGCCAA TCTCAGCGGG GCAGATCTCA GCGGGGCACA GCTTATATGC 
GCAATTCTCA CCAATGCAAC CCTTACTGGG GCAAACCTCA CTGAGGCATG CCTTAACTCG 
GCAGACCTCA CAAGGGCAAA TCTCATTGGG GGGGACTTCA CAAGGGCAAG TTTCAGCGGA 
GCAACCCTCG ATGAAGTACA GCTTGCAGGG GCAGACCTTA CTATGGCATT CCTCGGTCAG 
GCAAAGCTCT ACAGGTCAGA TCTCAGCGGG GCAAATCTAT GCGGCGCAAA GCTCAATAGA 
GCAACCCTTA TTGAGGCAAA TCTTAGCAAG GCAGACATGC ACGGGGTAAT CATCTGGCAT 
ACAATTTTTG TAAATGTAGA CCTTAGCAAC GTCAAAGGTC TTGACACTGT TCACCATGTG 
GGTCCATCTA CCGTAGGGAT TGATACTCTC TGCATATCAA AAGGGAATAT ACCCGAGGTA 
TTTCTGAAAG GCTGTGGTGT ACCAGATACC TTCATTGAAT ACGCGCACTC CCTCACCAGC 
AAAGCTATTG AATTCTACTC CTGCTTTATC AGCCATAGCA CTGCGGATAA AGCATTTGCA 
GATCGTCTCT ATGCTGACCT GCAAGCCAAA GGTGTTCGGT GTTGGTACGC TCCGCATGAC 
ATGAAGGGAG GCAAAAAAAT ACACGATCAA ATTGGTGAAG CCATACGACA ACATGAAAAG 
CTGCTGTTGA TTCTCTCCGA AAGCAGCATA AACAGTGACT GGGTAAAGCA GGAGATTATA 
AAAGCAAAAA AACGTGAGGA TACAGAAGGA AAGCGAGTGC TTTTCCCCAT CAGTTTGATT 
GAGTTTGGCA AGATTGAAGA ATGGGAGTTC CCTGACAGCA AAGGAAGGGA TTTAGCAGAA 
GAAATCAGGT TGTACTATAT CCCGTCATTT ATAGGGTGGG AAAAAGACAA CGCAGCCTAT 
ACAAAAGAAT TCGGAAAGCT GTTGAACTCA TTCCAGGCAG AGAAGGTCAC TGACGGAAAA 
GCCTGA

Protein sequence

MLTVELLLGS VTEWNAARKA HQKGRPNLKG ADLSGAQLNK ADLSRTDLVG ANLRGADLSG 
AQLNMADLNR ADLNGAHLYN ANFGKANLIK TNLSKANLSG ATLWDANLSG ADLSGAQLIC 
AILTNATLTG ANLTEACLNS ADLTRANLIG GDFTRASFSG ATLDEVQLAG ADLTMAFLGQ 
AKLYRSDLSG ANLCGAKLNR ATLIEANLSK ADMHGVIIWH TIFVNVDLSN VKGLDTVHHV 
GPSTVGIDTL CISKGNIPEV FLKGCGVPDT FIEYAHSLTS KAIEFYSCFI SHSTADKAFA 
DRLYADLQAK GVRCWYAPHD MKGGKKIHDQ IGEAIRQHEK LLLILSESSI NSDWVKQEII 
KAKKREDTEG KRVLFPISLI EFGKIEEWEF PDSKGRDLAE EIRLYYIPSF IGWEKDNAAY 
TKEFGKLLNS FQAEKVTDGK A