Gene Rcas_4124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4124
Symbol
ID	5541635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5337059
End bp	5338639
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	64%
IMG OID	640896236
Product	ABC transporter related
Protein accession	YP_001434174
Protein GI	156744045
COG category	[R] General function prediction only
COG ID	[COG1123] ATPase components of various ABC-type transport systems, contain duplicated ATPase
TIGRFAM ID	[TIGR01166] cobalt transport protein ATP-binding subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000316959
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGACCAT TGGTTGTCTG CGATGAGGCG ACCTATCGGT ATCGAGACGG AACGCTCGCC 
CTGGATCGTG TGTCGCTTGC CATCGAAACG GGAGAGTTCG TGGTGCTGGC AGGCGCGAGC 
GGGTCGGGCA AATCCACCCT CTGTCGCCTG CTCAACGGTC TCATTCCGCA CCTCCACGGC 
GGCGATCTGA CCGGGCGCGT CCTGATTGCG GGGCAGGATG TTCGCTCGAC GCCACCCTAT 
GCTCTGAGCC GCAGTGTGGG GCTGGCGTTG CAGAACCCCG AAGCGCAGAG CCTGGCAACA 
ACTGTTGCCC GCGATCTGGC GCTCGGTCCT GCATGCCACG GGCTTGACCG CGCGACGATT 
GCTGCGCGCG TCCGCGAGGT TGCTGCGCTA TTAAGGATTG AACCGCTCCT TGATCGCCAA 
CCGGTCACAC TGTCGGGAGG GGAATTGCAG CGGGTAGCCA TTGCCGGAGT GCTGGCGCTC 
CATCCACAGG TGCTGGCGCT CGATGAGCCG TTTGCGTTTC TCGACGCCGC CGGCGCTATG 
CGGTTGCGCG AGACATTGCG CATGCTCCAT GAACGGGGGG TCGCCATTAT CGTTGCCGAA 
CACCGTCTGG CAGACGTAGC AGACCTGGCG ACGCGCCTGA TCGTCCTTCA CGAAGGTCGG 
ATCGTGGCAG ATGGCGCGCC GCGAACGGTG CTGGCAGGCG ATGTGTCACA GTGGGGAGTA 
GAAGCGCCAC CATGGGCGCG CCTGGCGCAT GTTGCCGGGA TAGATGCGAT GTCGCCGACG 
CTTGATGGAG CGCTTGATCT GGCGTCGCCG AACGGCAGTG CGCTCCATTC GTCACCGCAC 
AATGCACCGG TTACACCGCC AGCGCTTAAC TGGGATGACG TATCATTTGC GCGCAACGAC 
AGGATAGTGC TGCATCAGGC GTACCTGTCG GCAGCGGCGG GGGAAATTGT TGGGGTGCTG 
GGCGCGAATG GCGCGGGTAA AACGACGCTG CTCAAGCTGG GCAACGGGTT GCTTCGGCCA 
CAACGCGGAA CGGTGCGTGT TCAGGGACAG GCAATCGGGC AACGTCCGCT CTGGGAGGTC 
GCGCGCAGTG TCGGTCTGGT GGGACAACAG CCGGGACATA TGCTGTTTGC GCCGACGGTG 
CAGGACGAAC TGGAGGCGGG ACCACGGGCG CTCCGGCGAG TTGATCGCGC CTGGATCGGC 
CACGTGATCG AGCAGTGCCG TCTGGAACCG TTGCTCCACC GTTCGCCACA TCATTTGAGC 
GCGGGCGAAC AGCGGCGCGT GGCAATCGGG GCTGTGCTGG CGTCGCAACC ATCCGCGCTG 
CTCCTCGACG AGCCGACATC CGGGCAGGAT GCGCTCAACC GAAAGGCTTT GCAAAAGATC 
ATTGGCGACA TCGCCCGCGA TGGAATGGCG GTCGTTATCG CCACTCACGA CACTGAATGG 
GCATATGCGC TCTGCACCCG CTGGGCAGTG CTGGATGCCG GCAGGATCAT TGCGAGCGGC 
GCGCCATCGG CAATATGCGC GCAACCGGCA ATCGTCGCGC AGGCGCGCCT TCGCCTCCCA 
ATGGCAGAGG CGATCCGGTA G

Protein sequence

MRPLVVCDEA TYRYRDGTLA LDRVSLAIET GEFVVLAGAS GSGKSTLCRL LNGLIPHLHG 
GDLTGRVLIA GQDVRSTPPY ALSRSVGLAL QNPEAQSLAT TVARDLALGP ACHGLDRATI 
AARVREVAAL LRIEPLLDRQ PVTLSGGELQ RVAIAGVLAL HPQVLALDEP FAFLDAAGAM 
RLRETLRMLH ERGVAIIVAE HRLADVADLA TRLIVLHEGR IVADGAPRTV LAGDVSQWGV 
EAPPWARLAH VAGIDAMSPT LDGALDLASP NGSALHSSPH NAPVTPPALN WDDVSFARND 
RIVLHQAYLS AAAGEIVGVL GANGAGKTTL LKLGNGLLRP QRGTVRVQGQ AIGQRPLWEV 
ARSVGLVGQQ PGHMLFAPTV QDELEAGPRA LRRVDRAWIG HVIEQCRLEP LLHRSPHHLS 
AGEQRRVAIG AVLASQPSAL LLDEPTSGQD ALNRKALQKI IGDIARDGMA VVIATHDTEW 
AYALCTRWAV LDAGRIIASG APSAICAQPA IVAQARLRLP MAEAIR