Gene Rpal_3454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_3454
Symbol
ID	6411128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	3697207
End bp	3698685
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	67%
IMG OID	642713333
Product	hypothetical protein
Protein accession	YP_001992430
Protein GI	192291825
COG category	[S] Function unknown
COG ID	[COG0397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.160092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCTC ATTTTCCGTT CGACAACAGC TACGTGGCGC TCCCGCCGAA CTTCTTCGCG 
CGGGTTGCGC CGACGCCGGT CGCCGCCCCC CGGTTGATCA AGCTGAACCG CCCGCTCGCG 
GTGCAGCTCG GGCTTGATCC GGACCTGCTC GAGACGCCCG AGGGCGCGGA GATTTTATCC 
GGTAACCAAA TGCCGGAGAC CGCAGCCTCG ATCGCGATGG CCTATGCGGG CCACCAGTTC 
GGCAACTTCG TGCCGCAGCT CGGCGACGGC CGGGCGATCC TGCTCGGCGA GGTGGTCGAC 
CGCAACGGGG TTCGCCGCGA TATCCAGCTG AAGGGCGCCG GCCGGACGCC GTTTTCGCGG 
ATGGGCGACG GCCGCGCCGC GCTCGGCCCG GTGCTGCGCG AATACATCGT CAGCGAAGCG 
ATGGCAGCTC TTGGCATCCC GACCACCCGC TCGCTCGCCG CGGTGCTGAC CGGCGAAACG 
GTGCTGCGCG ATCCGATCCA GCCGGGCGCT GTGCTGACGC GGGTGGCCTC CAGCCATATC 
CGGGTCGGCA CCTTCCAGTA TTTCGCCGCC CGCGGCGATC TCGCCAGCGT CCGGGCGCTC 
GCCGACCATG CCATCGCCCG CCACTACCCG GAGGCGGCTC AGGCGCCCTC GCCTTATTTG 
GCCCTGCTCG AAGGCGTGAT CGGCCGTCAG GCGGAACTGG TGGCGAGCTG GATGATGGTC 
GGCTTCATCC ATGGGGTGAT GAACACCGAC AACTGCTCGG TTGCCGGCGA GACCATCGAT 
TACGGCCCCT GCGCCTTCAT GGACACCTTC GATCCGAAGA CCGTTTACTC CTCGATCGAC 
CAGTTCGGCC GTTACGCCTA CGGCAACCAG CCCCCGATCG CCTTGTGGAA CCTGACCCGG 
CTGGCCGAAT GCCTGGTCCG GCTATTGGCC GATGACGACG ACAAGGGCAT CGAAATCGCC 
CAGACCGCGC TCGGCGGCTT TGCGGAGCGG TTCAACGCCG CGTATCTGGC CAAGCTGGCG 
GCCAAGCTCG GCCTGTTCAC CAGCCAGCCG GACGATCAAC AGTTGTCGCA GGAATTCCTG 
ACCGCCCTGG CCAAGGGCGA AGCGGACTTC ACCCTCGCCT TCCGCCGGCT GAGCGACGCG 
GCTGTCGATC CGTCGGACCT CGGTGAGGTT CGCGCCCTGT TTGCCGATCC GGCGGCGTTC 
GACGAGTGGG CCCCGCGGTG GCGCGCCCGG ATCGCAGCCG AGCCGCAGGA TGCAACGACT 
CGCCAGGCCG CGATGCGGCG GGTCAACCCG GCCTATACCC CGCGTAATCA CCGGATCGAA 
GCGGTGATCC GGGCCGCGGT CGACCGGGAC GATTTCGCTC CCTTCGAAGA GATCCTGACG 
GTGCTCGCCA ACCCCTTCGA GGAAAAGGCG GAATTCGCCC GCTATGCGGA GCCGCCGCAG 
CCCCATGAAG AGGTGCTGGA AACCTTCTGC GGAACTTGA

Protein sequence

MTAHFPFDNS YVALPPNFFA RVAPTPVAAP RLIKLNRPLA VQLGLDPDLL ETPEGAEILS 
GNQMPETAAS IAMAYAGHQF GNFVPQLGDG RAILLGEVVD RNGVRRDIQL KGAGRTPFSR 
MGDGRAALGP VLREYIVSEA MAALGIPTTR SLAAVLTGET VLRDPIQPGA VLTRVASSHI 
RVGTFQYFAA RGDLASVRAL ADHAIARHYP EAAQAPSPYL ALLEGVIGRQ AELVASWMMV 
GFIHGVMNTD NCSVAGETID YGPCAFMDTF DPKTVYSSID QFGRYAYGNQ PPIALWNLTR 
LAECLVRLLA DDDDKGIEIA QTALGGFAER FNAAYLAKLA AKLGLFTSQP DDQQLSQEFL 
TALAKGEADF TLAFRRLSDA AVDPSDLGEV RALFADPAAF DEWAPRWRAR IAAEPQDATT 
RQAAMRRVNP AYTPRNHRIE AVIRAAVDRD DFAPFEEILT VLANPFEEKA EFARYAEPPQ 
PHEEVLETFC GT