Gene Caul_1865 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1865
Symbol
ID	5899320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2000015
End bp	2001736
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	64%
IMG OID	641562355
Product	TonB-dependent receptor
Protein accession	YP_001683492
Protein GI	167645829
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCCACT ATCCCGCTTC GCTGGGCGGC GATCGGCCGT TCAACACCGG CGGCTATGCG 
GTCAACACCA TCGCCGGCGC GGCCTCCTTG CCCGCCAAGG TGGACTATAC CGGCAACAAG 
CCGGTCTTCA CCCTGCCCAG CCAATTGCTG ACTGAACTGG GCGACATCAA CAGTTATGCG 
CTCAAGACCA TTTCCTCGGA AGGCAACTAC CGCCGCGAAG GCGACCTGAA GGTCATCCGA 
GCCGACGGCA AGTACGAGTT CAACGACAGC TTCAAGCTGT CGGCCGGCGC GCGCTATTCC 
GAGCGCTCGG TCGACGACTT CGAGTTCGAT CGCGCCGCCC CGCTCTACGG CAGCGCCGCA 
TCGAACGGCA CGGGCTGCCT GGTCAAGTGG AAGGCCTTCG ACGTCCCGCT CAGCGACAGC 
AGCTGCAGCG CCGGCAACGC CGCGGGCTTC TACACCGCCG GTCTGACCCG CAAGGCCAAT 
GACCCGACCC TGAACGGTGA AGTCAAGCTG TTCAACCCCG GCGTCGCGGG CGTGCCGTCG 
ATGTACGTGC TCGACCCGAA GGCCATGGAC CACGCCCTGG CGTTCCAGAA CCGCTTCTAT 
CCGGGCAATG TCGAGATCAT GAACCCGGGC GCCTCGTTCA ATGTCGGCGT CAAGCAGACC 
TCGGCCTATC TGCAAGCCGA CTTCAAGGGT GAAGTCTTCG GCCTGGGCTT CACCGGCAAC 
GCCGGCGTCA AGGTCATCCA GACCAAGCTC GACATCACCC AGTACGTCAC CGGCAGCCCG 
CGCCCCTACG GCGTGGCCAA CCTGCTGGCC GGCAGCGTCG AGACCAACCG CAAGTTCACC 
GACGTCCTGC CGGCGATGAA CGTCGCTTTC GATGTCGCCG AGAACGTCAA GCTGCGCTTC 
GCCGCTTCCG AGACCATGAC GCTGCTGGAT CTGAACCAGT GGGGCGGCGG TCTGAACCCG 
ACCTACGCCA TCGACACCAC CAATCCCGGT TCGCCGGTGT TCCGCGTCAC CGGCGGCAGC 
CAGAACGGCA ACCCCGCGCT CGATCCCTGG CGAGCCAAGA ACTTCGAAGG CTCGCTGGAG 
TATTATCTCG GCAGCGCCAG CATGCTGAGC GTCGGCGCCT TTTACATGAA GGTCGACAGC 
TTCATTCAGA ACGGCTCGAT CGTCCGCACC GACCTGCCCG ACAACGACGG GGTGGTGCGC 
AACCGCACCG TCTCGATCAG CACCCAGGTG CAAGGCGACG GCGGTACGCT GAAGGGTCTG 
GAAGCCGGCG CCAAGCTGGC CTTCAACGAC CTGTCGTTCA TGCCCGCGAT GCTGTCGAAC 
TTCGGCGTCG ACACCAACTT CACCTACGCG CCGTCGAAGT CGGGCAAGAA AGATCTGGCC 
GGGGCCTCGA TCCCCTTCCA GGACAACTCG AAGTACCAGG CCAACCTCGC GGCCTACTAT 
CAGGACGACA GGCTGCAGGC CCGGATCGCC TGGAACTACC GCTCCCGCCG CGCCGTGTCT 
CAAGACTTCG GCGGGACCAC GGGACTGGAA ATGTACCAGG CCCCGACCAA CTATCTCGAC 
GCCTCGGTCA GCTACGACGT CAAGCCGAAC CTGACCGTCT ACGTCCAGGG CACCAACCTG 
ACCAGCGAGT ACGAGAAGTA CTACCTCACC TGGAAGGACG AGCACGCCTA CAACAACGTG 
TTCGAGGCCC GCTACGTGGC TGGCGTCCGC TTCAAGTATT GA

Protein sequence

MGHYPASLGG DRPFNTGGYA VNTIAGAASL PAKVDYTGNK PVFTLPSQLL TELGDINSYA 
LKTISSEGNY RREGDLKVIR ADGKYEFNDS FKLSAGARYS ERSVDDFEFD RAAPLYGSAA 
SNGTGCLVKW KAFDVPLSDS SCSAGNAAGF YTAGLTRKAN DPTLNGEVKL FNPGVAGVPS 
MYVLDPKAMD HALAFQNRFY PGNVEIMNPG ASFNVGVKQT SAYLQADFKG EVFGLGFTGN 
AGVKVIQTKL DITQYVTGSP RPYGVANLLA GSVETNRKFT DVLPAMNVAF DVAENVKLRF 
AASETMTLLD LNQWGGGLNP TYAIDTTNPG SPVFRVTGGS QNGNPALDPW RAKNFEGSLE 
YYLGSASMLS VGAFYMKVDS FIQNGSIVRT DLPDNDGVVR NRTVSISTQV QGDGGTLKGL 
EAGAKLAFND LSFMPAMLSN FGVDTNFTYA PSKSGKKDLA GASIPFQDNS KYQANLAAYY 
QDDRLQARIA WNYRSRRAVS QDFGGTTGLE MYQAPTNYLD ASVSYDVKPN LTVYVQGTNL 
TSEYEKYYLT WKDEHAYNNV FEARYVAGVR FKY