Gene Pcal_1229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcal_1229
Symbol
ID	4910158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum calidifontis JCM 11548
Kingdom	Archaea
Replicon accession	NC_009073
Strand	-
Start bp	1143441
End bp	1144505
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	57%
IMG OID	640124983
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_001056120
Protein GI	126459842
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG1173] ABC-type dipeptide/oligopeptide/nickel transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.227271
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCC TCGACAGAGC CGCGGACCTA TTGATATCGC TGTTGGTGAA GCTCATCACG 
CTGGTTAGGA GAGACTGGTA TGCGAAGAAT AGGGCGAGGG TGGAGGAGTG GCGTCTAACT 
CTGTACGCGC TTAATAGATC GCCCACGGGG GTCGCGGGCC TCATACTCTC CATGGGGTTT 
GTAGTCGTCG GAATCGTCGG CCCCTTTGTG GCCCCCTACG GCTACGACCA GTTCCTCTAC 
TTAGAAAACC CGGACCTGTA TCTAGCCCCT CCTGGGTCCT ACGGCATGTT GCTGGGCACG 
GACATCTACG GGAGAGACGT TCTCAGCCTC ATGCTCTACG GGGCGAGGGT CTCGCTTGTG 
ATTTCTGTGG TTACAATCGC CCTGGGTGTG CCTCTGGGGA TTTTGCTGGG CCTCATCGCC 
GGCTACTACG GCGGGAAGAT AGACGAGGCT ATCATGAGGG TGACAGACAT GTTCCTCGCC 
TTCCCAGCGC TTGTCCTCGC GCTTGCGCTC GCCGCGACTC TGCCCCAGAG GATTAGGGAG 
GCGTTGGTGG AGAACCAAGC CTTTGCATAC GCCATGGCTG CGATCTTCGG CGTAAAGCCC 
GACGACGCTA TCCACCTCGC GCCTCTCATC TCCATCTTCA CAGCATTGAT AATTGTGTGG 
TGGCCCACCT ACGCGAGAGT CGTTAGAGGA ATGGTTTTAG TAGAGCGTGA GAAGACCTAC 
GTGGAGGCGG CTAAGGCGCT GGGGTACTCC TCTTGGAGGA TTATGACGAG GCACATTTTG 
CCCAACATAA TGTCCCCAGT GGTTGTGTTA ATAACCTTCG ACTTCGCCTC GGTGAACTTG 
CTCGCGGCGG GGCTAAGCTT TTTAGGCCTC GGCGCGCAGC CCCCCATAGT GGATTGGGGC 
TCTCTCATAA ACATGGGCGG TAGCCGCTTC CCCACTGCGT GGTGGCTTGT GTTCTTCCCA 
GGTGTCGCCA TTTTCCTGAC GGCACTGGGG TGGAACCTCC TTGGGGACGC TCTACGCGAC 
GTGTTTGACC CCAAGTTTAG GAGGAGGATA GAGTTTAGGG TATGA

Protein sequence

MKILDRAADL LISLLVKLIT LVRRDWYAKN RARVEEWRLT LYALNRSPTG VAGLILSMGF 
VVVGIVGPFV APYGYDQFLY LENPDLYLAP PGSYGMLLGT DIYGRDVLSL MLYGARVSLV 
ISVVTIALGV PLGILLGLIA GYYGGKIDEA IMRVTDMFLA FPALVLALAL AATLPQRIRE 
ALVENQAFAY AMAAIFGVKP DDAIHLAPLI SIFTALIIVW WPTYARVVRG MVLVEREKTY 
VEAAKALGYS SWRIMTRHIL PNIMSPVVVL ITFDFASVNL LAAGLSFLGL GAQPPIVDWG 
SLINMGGSRF PTAWWLVFFP GVAIFLTALG WNLLGDALRD VFDPKFRRRI EFRV