Gene Rpal_5055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5055
Symbol
ID	6412749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5437606
End bp	5439171
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	69%
IMG OID	642714940
Product	ABC transporter related
Protein accession	YP_001994019
Protein GI	192293414
COG category	[R] General function prediction only
COG ID	[COG3845] ABC-type uncharacterized transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCCCC CTTCTGATTC CGATCCGCGC GAGCCGTCGC CGCCGCTGTT TCAGGGGCGC 
GGGCTGACCA AGCGATTCGG CAGCTTTGTC GCCAATCAAG CGATCGATCT CGACATCGCC 
GGCGGCGAGG TCCACGCGCT GCTCGGCGAG AACGGCGCCG GCAAGTCGAC GCTGGTGAAG 
CTGATCACCG GGCTGCTGCA GCCGGACGAC GGCCGGATGA TCTGGCGCGG GACGCCGATC 
GCGTTCGCGG GCCCGGCGGA GGCGCGAGCT TACGGCATCG CCGCGGTGTC GCAGCACTTC 
GCCCTGTTCG ACAATCTCAC CGTGGTCGAG AATGTCGCGC TTGGGCTCGA TCGCCGCATC 
TCGGTCGGCA GGCTGGCGAC GGAGCTGGAG CAGATTTCGC AGCGCTACGG CCTGCCGCTC 
GATCCCAAGC GCGAGGTATG GCGGCTGTCG GTCGGCGAGC GGCAGCGGAT CGAAATCGTC 
CGCGCGCTGC TGCAAGACCC GCAGCTTCTG ATCCTCGACG AGCCCACCGC CGTGCTGACG 
CCCGCGGAAG CCGATAGGCT GTTCGACGTG CTGGAACGGC TGAAGGCCGA CGGCCGCGCG 
CTGCTGTACA TCTCTCACAA GCTCGACGAG GTGAAGCGCC TCGCCAGCGT CGCCACCATC 
CTGCGCGCCG GCCGCGTCGT CGGCAGCTGC GACCCACGCC AGGAAAGCGC CGCCTCGATG 
GCCCGGATGA TGGTCGGCAG CGACGTGACG GCGCCGAAGC AGTCCAGCCA TTCGATCGGC 
GGCCCGTTGC TGAGCGTCAG CAGTCTGACG CAGCGTCCTG ACGATCCGCA TGGCGTGACG 
CTGCGCGATC TCTCCCTCGA AGTCCGCAGC GGCGAGATCG TGGGTATCGC GGGAGTTGCC 
GGCAACGGCC AGGACGAGCT GTTCGCGGCG CTGTCCGGCG AGACGCCGGT CGCGCAATCG 
GACGCGATCC ATATTGCCGG CGAGGCCGCC GGAAGCCTCT CGATCAACCA GCGGCGCCGG 
CTCGGCGCCG CTTTCGTGCC AGAACAACGG CTCGGCCACG CCACCGTGCC AACCATGAGC 
TTGTCTGACA ACGCGCTGCT GACCGGACAC GCGACCGGCG CGCTGGTGAA GTTCGGCCTG 
GTCAACCGCG GCGCTGCGCT GGCGCTGGTC GATCGGGTCA GCGAGGCCTT CGACGTGCGC 
AAAGCCAGCC GAGATCCGGA GGCGGCGCGG CTGTCCGGCG GGAATTTGCA GAAGTTCATC 
GTCGGACGCG AGATCCTGCG GCAGCCCCGT CTGCTGATCG TCGATCAGCC GAGTTGGGGG 
CTGGATGCCG GCGCCGCCAG CGCGATCCGC CAAGCACTAC TCGATCTCGC CTCAAGCGGC 
GCGGCAGTGC TGGTGATCAG CCAGGACCTC GACGAGCTGA TCGAGATCGC CGATCGCATC 
GCGGTGATGT TTCACGGAAG GCTGTCGCCG CCGCGCCCCG TCAGCGAGAT CGGCCGCGAT 
CAGCTCGGGC TGTTGATGGG CGGCAGCGGC TGGCCGACGG AGGTGCGCGA TGTCGCTGGT 
GCTTGA

Protein sequence

MAPPSDSDPR EPSPPLFQGR GLTKRFGSFV ANQAIDLDIA GGEVHALLGE NGAGKSTLVK 
LITGLLQPDD GRMIWRGTPI AFAGPAEARA YGIAAVSQHF ALFDNLTVVE NVALGLDRRI 
SVGRLATELE QISQRYGLPL DPKREVWRLS VGERQRIEIV RALLQDPQLL ILDEPTAVLT 
PAEADRLFDV LERLKADGRA LLYISHKLDE VKRLASVATI LRAGRVVGSC DPRQESAASM 
ARMMVGSDVT APKQSSHSIG GPLLSVSSLT QRPDDPHGVT LRDLSLEVRS GEIVGIAGVA 
GNGQDELFAA LSGETPVAQS DAIHIAGEAA GSLSINQRRR LGAAFVPEQR LGHATVPTMS 
LSDNALLTGH ATGALVKFGL VNRGAALALV DRVSEAFDVR KASRDPEAAR LSGGNLQKFI 
VGREILRQPR LLIVDQPSWG LDAGAASAIR QALLDLASSG AAVLVISQDL DELIEIADRI 
AVMFHGRLSP PRPVSEIGRD QLGLLMGGSG WPTEVRDVAG A