Gene Sala_1186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1186
Symbol
ID	4080834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1226160
End bp	1227608
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	71%
IMG OID	638009547
Product	tetratricopeptide TPR_2
Protein accession	YP_616235
Protein GI	103486674
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0407507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGAAC AGGCGATCGC CGCGGGCGAC CTGGATGCGG CGCGGCGCGC GGCGCAGCAG 
GTCTGGACGG GCGGTGACCA TCGCTTCGAC GCGCAGCTCG TCCTCCTGGT CGATGCGATG 
CGGCGATCCG ACTGGAAGGC GGCGCGCGCC TATCTGGCGG CGCCGACCGA CAAGACCGGC 
GCGAATACGG GCGCGCGGCT GATCGTGCCG ATCTTTCAGG CTTGGATCGA TGTCGGCGCG 
CGCGCGCGGA GGCCCGAGCG CCACCTGATG GCGACCCCTG GCACAGGCGC AGAACCGGCG 
TTGATGCTCC AGGTCGTGCA GGTGCAGGCG GCAACGCGCC GCGCGGGCGA GGCGGCGCGA 
CTGGCGGACG AGATTGGTCT GAGCGACCGA CTCAGCCAGC TCGTCGCGTT GCGCGCCGCG 
GCGACGCTCG ATCGCGCGGG CGAGGGCGCC GCCGCCGGCC GACTCCGTGC GCGGATCGCG 
CTGGCGGCCG GTGAGCGCGA GGACCCGATG CTGCTGCTGC CCGATCAGCC GGTGACGACC 
CCGCGCGCGG GAAGCGCGCA GTGGCTCGGC CTGCTCGCCG ACGGCCTGGC GCGCACGCCG 
AACGCCAGCA CCAAATTGCC GTTGCTGTTC GCCCGCGCCG CGCATTGGCT GAACGACGAG 
GATTGGGCGG TGCGCGCAAC GCTGGTCGAG GCACTGGCTC GCGACGGGCA GAATGGCGCG 
GCCATGGCGC TGCTTGACGG CCTGCGAGGA AAGTTGCCCG CGGTGCTGGT CATGCGACAG 
GCCGAACTGA TCGCAGACAG CGGCGATTTG GCGGCAGGCC TCGAACGCGC CGAGGCGGCC 
GCGCGCAACG ATGCGCCGCG CATGTTGCTG GTGCGGCTTG CGGACCTTGC GCGGCGGTCG 
GGCAGTGCGG CGGCCGCGGC GGCCGCTTAT GAGCGGCTGG AGGCCGCGCT GGGTGAGGAG 
GACCGCGCGC TGCGCAGTTC GCTGTTGCTT GCTCGCGCCG AGTTGATGTT GCAGGCGGAC 
CAGTGGGACG CAGCGGCGCC GCTGATCGAG CGCGCCGTGG CCTTGCAGCC CGACGATCCC 
GCCGTGCTCA ATTTCGCGGG CTATTCGGCG CTCGAACGGC GCAAGGACAT GAAGCAGTCG 
CTCGCGCGGA TCGAGGCGGC GTGGGCCAGG GCACCGCAGA ATGCGAGCAT CACCGACTCG 
CTCGGATGGG CCTATTTCCT GATCGGGCGC ACCGACGAAG CGGTCGAATT GCTCGAACGA 
GCACAGCGCG GCGAACCCGA CAATGCGGTG ATCGTCGAAC ATCTGGGCGA TGCTTATTGG 
CAGGCGGGTC GCAAGTTCCA GGCGCGCTAT AACTGGCGCG CGGCAGCGCT GCTCGCCGAC 
GCCGAGATGG CGACGCGGAT CGAGGCGAAG CTGCGCGACG GGCTGACCCC GGCAACGGTG 
GCACCATGA

Protein sequence

MLEQAIAAGD LDAARRAAQQ VWTGGDHRFD AQLVLLVDAM RRSDWKAARA YLAAPTDKTG 
ANTGARLIVP IFQAWIDVGA RARRPERHLM ATPGTGAEPA LMLQVVQVQA ATRRAGEAAR 
LADEIGLSDR LSQLVALRAA ATLDRAGEGA AAGRLRARIA LAAGEREDPM LLLPDQPVTT 
PRAGSAQWLG LLADGLARTP NASTKLPLLF ARAAHWLNDE DWAVRATLVE ALARDGQNGA 
AMALLDGLRG KLPAVLVMRQ AELIADSGDL AAGLERAEAA ARNDAPRMLL VRLADLARRS 
GSAAAAAAAY ERLEAALGEE DRALRSSLLL ARAELMLQAD QWDAAAPLIE RAVALQPDDP 
AVLNFAGYSA LERRKDMKQS LARIEAAWAR APQNASITDS LGWAYFLIGR TDEAVELLER 
AQRGEPDNAV IVEHLGDAYW QAGRKFQARY NWRAAALLAD AEMATRIEAK LRDGLTPATV 
AP