Gene Rcas_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3033
Symbol
ID	5540529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3930825
End bp	3932663
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	62%
IMG OID	640895153
Product	citrate transporter
Protein accession	YP_001433106
Protein GI	156742977
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0471] Di- and tricarboxylate transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCTGA TTGTCTTTGG AGTGCTGGCG CTGACCATAA TCCTGTTCGC CAGTGATCGG 
CTCCGCCTCG ATGTGGTTGC GCTGCTGGCG TTGCTGGCCC TGCTGTTGAC GGGAATCCTC 
ACGCCAGCCG AGGCGCTCGC CGGATTTTCC GACCCGATTG TGCTGATCAT CGCCGGGTTG 
TTTATCGTCG GCGCCGGATT GTTTCAAACC GGCGTCGCCG ATGCGTTGGG GCAGCAACTG 
ATGCGCTTCG CCGGCGCCGG TGAAGCGCGC CTGATCGCCT CACTGATGCT CATTGTTGCG 
TTGCTTTCGG CATTTCTCAG TTCAACCGGA ACCGTCGCTG TTTTTCTGCC GGTGGCGGTG 
AGTCTGGCGC GACGCGCCGG CGTCAGCCCG GCGAAACTGC TGCTGCCGCT CGCCTATGGT 
TCGCTGATCG GGGGCCTGCT GACCCTTATT GGAACGCCAC CCAATATCGT CGTCAGCAAT 
CAATTGCAGG CAGCCGGACG CGCGCCGTTC GGGTTCTTTT CCTTTACGCC GATTGGACTC 
GTGATGCTGG CGATCGGCAT TGGGTACATG ATTACCGTCG GGCGACACAT GTTGCCCGTG 
CGCGCGCACC TTGCGGCTGC GTCAGGAAAC GGCAAACCAA TGGTCGATCC GGCGACATTG 
CTGGCATTGT ACGACCTCCC CGGCAAACTG GCGCGCGTGC AGATCGAGCC TTCGTCGCCG 
CTGGTTGGTC AAACGCTGGC ACAGGCGAGT TTACGCACCC GCTACCGCAT CAATGTCGTG 
GACGTTGAGC CACGTGTTCG CCAGGGGGCA ACTGCCGCGC CACACATCGC CGATTCGGGT 
GTAACGCTGC AACCGAGGGA TGTGCTGCTG GTCAAAGGCT CGGCGGAGGA TATTGCGCGG 
CTGGCAAGGG AACAGCAAAT GCGCGTGCTG GCGACCGGCG TCAGCCCTGA CGATCTGATC 
ACCGAGGAAA CCGGCATTGT GGAACTGGTG CTGACGCCAC GCTCACGCTT GATCGGGAAG 
TCGCTGCGCG AGACGCGCTT CCAGGACACC TATCGGGTGC TGGCGCTGGC AATTCTGCGA 
TTGGGCGCGC CGCTCGATGC CCCAACATCA CAGGTGGAAC TGCGATTTGG CGACACGTTG 
CTGGTTCAGG GAACATGGGA ACGGATCACC TCGCTACTCG ATGAACGCAA CGATTTTGTG 
GTTGTCGGCG AGGTGCATCG TCCACCGACA AAACGCGCTC TAACCCGACG CGCCCCCGTT 
GCGCTGGCAA TCATGCTGGG CATGCTGATT CTCATTTCGC TCGATATACT GCCCATGGTG 
ACCGCCGTGC TGCTTGCCGC CGTCGCTATG GTGCTGACCG GCTGCGTGTC GATGGAAGAA 
GGGTATCGGG CGATCAACTG GGAAAGCGTT GTGCTGATTG CCGGAATGCT GCCGATGGCG 
ACAGCGCTCG ACAAGACCGG CGGATTGCAA CTGATGGCGA GTGGGTTGAC AGCAACGCTC 
GGCGCACTGG GTCCGCTAGC GCTTATGGCG GGGCTGTTCA CGCTCACGGC GCTCTTCAGT 
CAGTTCATTT CCAACACTGC AACCACCGTG CTGATGGCGC CGATCGCGTT GCAGGCTGCC 
GCAGAACTCG GCGTCTCTCC CTACCCGCTG CTCATGATCG TCGCCATAGC CGCATCGACC 
GCCTTCGCCA CCCCAATTGC CTCGCCGGTC AACACGCTGG TGCTCGGACC GGGGGATTAC 
CGCTTCACCG ATTTTGTGCG GGTCGGAACG CCGCTGCTCG CGCTGACGTT GATCGCGTCG 
CTCGTGGCTG TGCCGGTGGT GTTTCCGCTA TGGTTGTAG

Protein sequence

MMLIVFGVLA LTIILFASDR LRLDVVALLA LLALLLTGIL TPAEALAGFS DPIVLIIAGL 
FIVGAGLFQT GVADALGQQL MRFAGAGEAR LIASLMLIVA LLSAFLSSTG TVAVFLPVAV 
SLARRAGVSP AKLLLPLAYG SLIGGLLTLI GTPPNIVVSN QLQAAGRAPF GFFSFTPIGL 
VMLAIGIGYM ITVGRHMLPV RAHLAAASGN GKPMVDPATL LALYDLPGKL ARVQIEPSSP 
LVGQTLAQAS LRTRYRINVV DVEPRVRQGA TAAPHIADSG VTLQPRDVLL VKGSAEDIAR 
LAREQQMRVL ATGVSPDDLI TEETGIVELV LTPRSRLIGK SLRETRFQDT YRVLALAILR 
LGAPLDAPTS QVELRFGDTL LVQGTWERIT SLLDERNDFV VVGEVHRPPT KRALTRRAPV 
ALAIMLGMLI LISLDILPMV TAVLLAAVAM VLTGCVSMEE GYRAINWESV VLIAGMLPMA 
TALDKTGGLQ LMASGLTATL GALGPLALMA GLFTLTALFS QFISNTATTV LMAPIALQAA 
AELGVSPYPL LMIVAIAAST AFATPIASPV NTLVLGPGDY RFTDFVRVGT PLLALTLIAS 
LVAVPVVFPL WL