Gene Rpal_4191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4191
Symbol
ID	6411875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4494556
End bp	4495878
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	63%
IMG OID	642714073
Product	urea ABC transporter, urea binding protein
Protein accession	YP_001993162
Protein GI	192292557
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTG AAACCAAGCG ACTTGGAGCG ACCCCGATCA GCCGCCGCAA ATGGCTGGCC 
GCGGCGGCCG GCCTGGCTTT GGGCCTGTCG GCGTTCGGAC CGGCCAAGGC GGCGGACGAC 
ACCATCAAGG TGGGCGTGCT GCATTCGCTG TCCGGCACCA TGGCGATCAG CGAGACCACG 
CTGAAGGACA CGGTGCTGTT TCTGATCGAC GAGCAGAACA AGAAGGGCGG CGTGCTCGGC 
AAGAAGCTCG AGGCGGTGGT GGTCGATCCG GCGTCGAATT GGCCGCTGTT CGCCGAGAAG 
GCCCGCGAGC TGATCACCAA GGACAAGGTC TCGGTGGTGT TCGGCTGCTG GACCTCGGTG 
TCGCGCAAGT CGGTTCTGCC GGTATTCAAG GAGCTGAACT CGATCCTGTT CTACCCGGTG 
CAGTACGAAG GCGAGGAGAG CGAGCGCAAC GTGTTCTACA CCGGCGCCGC GCCGAACCAG 
CAGGCGATCC CGGCGGTCGA CTACCTCGCC AAGGAAGAAA AGGTCGAGCG CTGGGTGCTG 
GCCGGCACCG ACTACGTCTA TCCGCGCACC ACCAACAAGA TCCTCGAAGC CTATCTGAAG 
TCGAAGGGCG TCAAGTCCGA AGACATCATG ATCAACTACA CCCCGTTCGG TCACTCGGAC 
TGGCAGACGA TCGTCGCCGA CATCAAGAAG TTCGGCTCGG CCGGCAAGAA GACCGCCGTG 
GTCTCGACCA TCAATGGCGA CGCCAACGTG CCGTTCTACA AGGAGCTCGG CAACCAGGGC 
ATCAAGGCCA CCGACATTCC GGTGGTGGCG TTCTCGGTCG GCGAAGAAGA GCTCGCCGGC 
ATCGACACCA AGCCGCTGGT CGGCCATCTC GCCGCCTGGA ACTACTTCCA GTCGATCAAG 
ACCCCCGAGA ACGAGCAGTT CATCAAGGAC TGGCAGGCCT ACACCAAGAA TCCGAAGCGC 
GTGACCAACG ACCCGATGGA AGCCCATGTG ATCGGTTTCA ACATGTGGGT GAAGGCGGTC 
GAGAAGGCCG GCTCGGTCGA TCCGGACAAG GTGATCGACG CGCTGCCGGG CACCAAGGCG 
CCGAACCTGA CCGGCGGCAT CTCTGAAATG CTGCCGAACC ACCACATCAC CAAGCCGGTG 
TTCATCGGCG AGATCAAGGC CGACGGCCAG TTTGACGTGG TGTGGAAGAC CCCGGGCCTG 
GTGCCGGGCG ACGCCTGGTC GAAGGAGCTG GAAGGCTCGA AGGACCTGAT CGGTGACTGG 
GTGACGCTGA AGTGCGGCAA CTACAACACC GTGACCAAGA AGTGCGGCGG CCAGGGCACC 
TAA

Protein sequence

MRIETKRLGA TPISRRKWLA AAAGLALGLS AFGPAKAADD TIKVGVLHSL SGTMAISETT 
LKDTVLFLID EQNKKGGVLG KKLEAVVVDP ASNWPLFAEK ARELITKDKV SVVFGCWTSV 
SRKSVLPVFK ELNSILFYPV QYEGEESERN VFYTGAAPNQ QAIPAVDYLA KEEKVERWVL 
AGTDYVYPRT TNKILEAYLK SKGVKSEDIM INYTPFGHSD WQTIVADIKK FGSAGKKTAV 
VSTINGDANV PFYKELGNQG IKATDIPVVA FSVGEEELAG IDTKPLVGHL AAWNYFQSIK 
TPENEQFIKD WQAYTKNPKR VTNDPMEAHV IGFNMWVKAV EKAGSVDPDK VIDALPGTKA 
PNLTGGISEM LPNHHITKPV FIGEIKADGQ FDVVWKTPGL VPGDAWSKEL EGSKDLIGDW 
VTLKCGNYNT VTKKCGGQGT