Gene Rpal_2663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2663
Symbol
ID	6410326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	2892888
End bp	2894126
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	62%
IMG OID	642712539
Product	putative UreA/short-chain amide transport system substrate-binding protein precursor
Protein accession	YP_001991648
Protein GI	192291043
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR03669] urea ABC transporter, substrate-binding protein, archaeal type

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0749447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGAA CTGTATTACG GGGACTGCAT GCCGCAGTCC TCACGGGGAC GCTTGTCCTC 
GCGTCAGGCG CGGCGCTGGC CGCGGAGAAG CCGATCAAGC TCGGCGTGCT GGAGGATCAG 
TCGGGCGATT TCGCGGTGGC GACGATCGGC AAGGTCCACG CCATCCAGCT TGCCGCCGAC 
GAGATCAACA AGGCCGGCGG CATCATGGGG CGGCCGCTCG AACTGGTGGT GTACGACACC 
CAGTCCGACA ACACCCGCTA TCAGGAGTTC ATGCGCCGGG TGCTGCAGCG GGACAAGGCC 
GATGCGGTGT TCGCCGGATT CTCCTCGGCC TCGCGCGAAG CCTATCGGCC GATCGTCGAT 
CAGCTCAACG GTCTCGCCTT CTACAACAAC CAGTATGAAG GCGGTGTCTG CGACGGTCAT 
ATGATCGTCA CCGGCGCGGT GCCCGAGCAG CAGTTCTCGA CGCTGATCCC GTGGATGATG 
GAGAAGTACG GCAAGAAGGT TTACACGCTC GCCGCCGACT ACAATTTCGG CCAGATCTCG 
GCCGAGTGGG TGCGCAACAT CGTCAAGCAG CATGGCGGCG AAATGGCCGG CGAGGAGTTC 
ATCCCGCTCG GCGTGTCGCA GTTCTCGCAA AGCATCCAGA ACATCCAGAA GGCCAAGCCG 
GACTTCGTGG TGACGCTGCT GGTCGGCACC GCGCAGGCTT CGTATTACGA GCAGGCCGCT 
TCCGCCAACG TCAATCTCCC GATGGCGTCC TCGGTCAACG TCGGCCAGGG CTACGAGCAC 
AAGCGCTTCA AGCCGCCGAG CCTGAAGGAC ATGTACGTCA CCACCAACTA CATCGAGGAA 
ATCGACTCGC CGCAGAGCAA GGCGTTCCTG GCCAAGTTCA AGGCCAAGTT CCCGAACGAG 
CCTTATGTCA ATCAGGAGGC CGAGAACTCC TATCTGGCGG TCTATCTCTA CAAGCAGATG 
GTGGAGCGGG CGAAGTCGAC CAACCGCGAC GAGATCCGCA AGGTGATCGC GCAGGGCGAC 
GTCTGCATGG ATGCGCCGGA AGGCAAGGTC TGCATCGACC CGAAGAGCCA GCACATGTCG 
CACACCATCT ACCTGGCGCA CGTCAATGCC GATCACTCGA TCGACTTCCC GAAAGTCTGG 
CCCGACATCA AGCCGTATTG GCTGGGTGAG GCCGGCTGCG ACCTGACCAA GAAGGATCCG 
ATGGCGCAAT ACACGCCGTC GAACCCGCCG CCCAAGTAA

Protein sequence

MTGTVLRGLH AAVLTGTLVL ASGAALAAEK PIKLGVLEDQ SGDFAVATIG KVHAIQLAAD 
EINKAGGIMG RPLELVVYDT QSDNTRYQEF MRRVLQRDKA DAVFAGFSSA SREAYRPIVD 
QLNGLAFYNN QYEGGVCDGH MIVTGAVPEQ QFSTLIPWMM EKYGKKVYTL AADYNFGQIS 
AEWVRNIVKQ HGGEMAGEEF IPLGVSQFSQ SIQNIQKAKP DFVVTLLVGT AQASYYEQAA 
SANVNLPMAS SVNVGQGYEH KRFKPPSLKD MYVTTNYIEE IDSPQSKAFL AKFKAKFPNE 
PYVNQEAENS YLAVYLYKQM VERAKSTNRD EIRKVIAQGD VCMDAPEGKV CIDPKSQHMS 
HTIYLAHVNA DHSIDFPKVW PDIKPYWLGE AGCDLTKKDP MAQYTPSNPP PK