Gene Caul_4039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4039
Symbol
ID	5901501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4374973
End bp	4376850
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	69%
IMG OID	641564560
Product	ferrous iron transport protein B
Protein accession	YP_001685662
Protein GI	167647999
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0370] Fe2+ transport system protein B
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00437] ferrous iron transporter FeoB

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.129654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCGACA CCGTCGCCCT GCGGCCCGCG CGTCTGGCGC TGGTCGGCAA TCCCAATTGC 
GGCAAGACCG CCCTGTTCAA CGCCCTGACC GGCAGCCGCC AGAAGGTGGC CAACTACGCC 
GGCGTCACCG TCGAGCGGAA GGAGGGCGTC CTGACCCTGC CTGGCGGTCG CGGCGCGCAC 
ATCCTCGACC TGCCCGGCAC CTATTCCCTG CGCGCCCGCA GCCCCGACGA GGCGGTCACC 
CGCGACGCGG TGCTCGGCCG CTTGTCGGGC GAACAGGCGC CCGACGTGGT GATCTGCGTG 
GCCGACGCCA CCAACCTGCG GCTGGTGCTG CGCCTGGTGC TGGAGCTCAA GCAGGTCGGC 
CGGCCGTTCG TGCTGGCCCT CAACATGTTC GACATCGCCC AGCGCCAGGG CCTGCGCATC 
GATCTTGCGC GGCTGTCGGC CGAGATCGGC GCGCCGATCG TCACCACCGT GGCCACCCGC 
AAGCGCGGGC TGGACGAACT GGTCGCCAAG GCCGACGCCC TGGCCCTCAG CCAGGAGGGC 
GAGCACGTCA GCACCTGGCG CGAGCCCTCG GCCGCCGAGA TCCGCGCCGC CCACCGCGAG 
GCCCAACGGA TCGTCAAGGC CTGCGTCCGC CCGCCCGAGC GTCCCGACAC CGTGACCGGC 
AAGATCGACT CGGTGCTGCT CAACCCGGTC GGCGGCCTGC TGATCCTGGG CGTGCTGCTG 
TTCGTGATGT TCCAGGCGGT GTTCACCTGG GCCGAGCCGC TGATGACCCT GATCGAGGCG 
GGCTTCACCC TGCTGGGCGG GGCGATTGGG AGCGTGCTGC CCGAGGGTCT GCTGCGTAGC 
TTCGTCACCG ACGGCCTGAT CGCCGGGGTC GGCAGCGTGC TGGTCTTCCT GCCGCAGATC 
CTGATCCTGT TCTTCTTCAT CCTGGTGCTG GAAGACAGCG GCTACATGAC CCGCGCGGCC 
TTCCTGATGG ACAAGATCAT GGGCGGGGCG GGGCTGCACG GCCGGGCGTT CATTCCGCTG 
CTCAGCAGCT TCGCCTGCGC CATCCCCGGG ATCATGGCCA CCCGGGTGAT CGACAACAAG 
CACGACCGGC TGACCACCAT CCTGGTCGCC CCGCTGATGA CCTGCTCGGC GCGGATCCCG 
GTCTACACCC TGATCATCGC CGCCTTCATT CCCCACACCA AGGTCTGGGG CGGGCTGAGC 
CTGCCGGGCC TGGTGATGTT TGGCCTCTAC GCCAGCGGCA TCGTCAGCGC GCTCGTCGTG 
TCGTTCGTGA TCCGCAAGAT CTTTTGGCGG GGCACGGTCG AGCCGTTCAT GATGGAGCTG 
CCGACCTACC GCTGGCCCGA GCCGCGCAAC GTGCTGATGA ACCTGTGGAC CCGGGCCCAG 
ATCTTCCTCA ACCGCGCAGG CCGGATCATC CTGCCGCTGA TGGTGCTGGT CTGGGTGCTG 
TCGACCTTCC CCTATCCGCC GCAAGGCGCG ACGGGGCCTG CCATCGACTA CAGCTTCGCC 
GGACGGATCG GACACCTGAT CGCGCCGGTC ATGCAGCCCA TTGGGTTTAA TTGGCAGATG 
ACCGTGGCCC TGATCCCGGG CTTCGCGGCG CGCGAGGTCG CGGTGGCGGC CCTGGGCACG 
GTCTACGCCG TGGGCGGCGA CGACGAGGCC GGTACGGCCT TGGGGACCCT GTTGGCGCAC 
AAATGGTCGC TGGCCACCGC CCTGTCGTTC CTGGCCTGGT ACGTCTTCGC CCCGCAATGC 
GCGGCGACCC TGGGCGTGGT CAAGCGTGAG ACCAACGGCT GGACCTGGCC GACGGTGATG 
TTCCTCTACA TGACCAGCCT GGCCTATCTG GCCTCGTTCA TCACCTACCA TGTCGCCGTG 
GCGATGGGGG CGGGGTAG

Protein sequence

MTDTVALRPA RLALVGNPNC GKTALFNALT GSRQKVANYA GVTVERKEGV LTLPGGRGAH 
ILDLPGTYSL RARSPDEAVT RDAVLGRLSG EQAPDVVICV ADATNLRLVL RLVLELKQVG 
RPFVLALNMF DIAQRQGLRI DLARLSAEIG APIVTTVATR KRGLDELVAK ADALALSQEG 
EHVSTWREPS AAEIRAAHRE AQRIVKACVR PPERPDTVTG KIDSVLLNPV GGLLILGVLL 
FVMFQAVFTW AEPLMTLIEA GFTLLGGAIG SVLPEGLLRS FVTDGLIAGV GSVLVFLPQI 
LILFFFILVL EDSGYMTRAA FLMDKIMGGA GLHGRAFIPL LSSFACAIPG IMATRVIDNK 
HDRLTTILVA PLMTCSARIP VYTLIIAAFI PHTKVWGGLS LPGLVMFGLY ASGIVSALVV 
SFVIRKIFWR GTVEPFMMEL PTYRWPEPRN VLMNLWTRAQ IFLNRAGRII LPLMVLVWVL 
STFPYPPQGA TGPAIDYSFA GRIGHLIAPV MQPIGFNWQM TVALIPGFAA REVAVAALGT 
VYAVGGDDEA GTALGTLLAH KWSLATALSF LAWYVFAPQC AATLGVVKRE TNGWTWPTVM 
FLYMTSLAYL ASFITYHVAV AMGAG