Gene Acid345_3841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3841
Symbol
ID	4070992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4547532
End bp	4550903
Gene Length	3372 bp
Protein Length	1123 aa
Translation table	11
GC content	55%
IMG OID	637985864
Product	TonB-dependent receptor
Protein accession	YP_592915
Protein GI	94970867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATCGTA CCCTCCGTTC GCTCTGCATA CTTGTTTTAC TAAGTTGTCT CTCGATCGTC 
TCACGCCTGG TTGCGCAGGA TGCGGCCGGT ACCATCTTCG GAACCATCAC TGATCTACAG 
GGCTCGGTCG TTCCGGATGC GCGTGTTCGC GTGACGAATG GCGCCACGGC GGTTTCAAAA 
GAGACAGTCA CGGGCAAAGA CGGTTCGTTT CGAGTACTCG ACCTTCCTGT GGGCAAATAC 
ACGGTGACCG CCGAAAGCCC GGGCTTTGCT GTGACGCACT CCGAAGAGAA GCCGCTACAG 
ATCAATCAGA ACCTTCGGAT CGACATTCGC TTGCAGGTCG GAACCGAAAA AACGGTCGTC 
GATGTGACCG GGGAGGCCGC CGGTGTCGAG ACCGTAAACT CAACCCTCGG TCAATCGGTG 
ACGAGCCGTC CCCTGGTGGA TCTTCCGCTG AATGGTCGCG ACGTTCTGCA GTTGGCGTTA 
CTGCAGCCAG GAGTAACGGA GACCAACGAG GGTAACACTG GCGCCGGCAG TTATAGCATC 
GGCGGAGGGC GAAGTGATTC AGTCACGTTT CTACTCGACG GAGGCATTAA CAACGATTTG 
TTGGGCAACG AAGTCGTGTT CAACCCCAAC CCAGATGCAA TCGCGGAGTT CAGAATCCTC 
CAGAACAACT ACACGGCGGA ATACGGGCGT AATGGCGGCG GCGTGATCAG CGTAGTCACG 
AAGTCAGGAG GCAACAACTT CCACGGAAGC GGCTTTGAGT TCCTGCGCAA TGATGCGTTC 
AATGCGAACT CCTACTTCAA CAAGCTGAAC GACCTCCCGC GGAATGTGCT GAAGCGGAAC 
CAGTACGGCG GCACAATCGG CGGTCCAATC ATCAAGAACC GGTTGTTCTT CTTCGTGTCG 
TACCAGGGTC AAAGGCTCAC CGCGACAGAA GACCCTTCCT TGTACGGGAA TTCGACGACG 
ACGACGGTAT TTACGAATCC CGAGCTGCAG AATGGCGATT TTGGCGGAGA CCCGAATGTC 
GCAAACTTCC TGAACGCGCA CCCGTACTTT ATCGCACCAG GACATACCGC AGCGGACGCT 
GTCATCGATC CTGCAAAGTT CGATCCCGTA GCACAGAAGT ACATCGGACT TGGCCTGATT 
CCAAGCACTT CGACTGGCGA ACTGAACGCC ATCGGCAACC AGACAGACAA TCGCAACGAA 
CTGAGTGCGA AGATCGATTT TCAGCTCGAT GAACAAGACA AGATTGGCGC AACGTTTGGT 
GGCAATCGCA ATTCTGAGAC GGATGACTTC CGATTCTCGA ACGTCCCGGG ATCTCCCGTA 
TCCAATCACT ACAGCCAGAA TTTCCTGACA CTCGCCTACA CTCGGACCTT CTCAAATAGC 
ATGCTGAACG AGTTCCGTTT CACCGCGCAA CGTACGACCC ACCTGCAGGA TGCGCCCCTG 
GGAGCGAAAC ATACGCCCGC CGATGTTGGG GTCGGGATTC ACTCTGACGA TCCCACGGGC 
GTGACCGTGT TGGGGTTCGA CAACGGCTTG ACAATTGGGC CAAGCCTGTT CGGACCGACT 
AATTTCGCGA GCAACACTTT CTCGTATTCC GATAATTTCT CGTGGGTTCG AGGCAAGCAC 
TCCTGGAAGT TCGGCGCGGG ATTTACTCCG TACCAGAACA ACACGCTGTA CGACTTTTAT 
GTAAACGGGT ATTTCCAGTT CAACGGCACG GGCAGCGGGA ATTCATTGGC TGACTTTTTG 
CTGGGAGTTC CGACGTATTA CATCCAGTAT CCCCAGGCCC CGTCGAACAT CCGCAGCAAG 
AACACATTCT TGTATGCGCA GGACGAGTGG CATGTGTCGC GCAGGCTGGT GCTCAACCTG 
GGACTGCGGT ATGAGTACAG CACACCGAAG ATCGACACGG AGGGAAGAAG CTATTCAATT 
ATTCCCGGAC AACAGTCGAC AGTGTTTCCG AATGCACCGA ATAGCCTCGT TTTTCCCGGC 
GATAAGGGCA CGCCTACAGG GGCCAACTTC CCGGACAAAA ACGATTTCGG GCCGCGCTTA 
GGTTTCGCTT ATGACGTTTT CGGAGACGGT AAAACTAGTT TACGTGGCGG CGTCGGGCTG 
TTTTACGACA TCCTGAAGGG CGAAGACAAT CTTCAATTCA ACGGTCAGCC TCCGTTCTTT 
TCGTCCGCGG GTTTGCTGTT CCCCGACGCG ACGGCCAACT CCAATTACGC TTTTCTGGCC 
GATCCGTACG GAAGCGCCGG GGTTACGGAC CCGTTCCCCT CGAAACCCGT TGACCACAAC 
CTCGATTTCG GCGCCGCAGG GTTCTTGCCG TTCAACAACG CGGGCTCGGC GTTCTTCGTC 
GATCCACATT TGCGCACGCC GTATACCTAT CAGTACAACT TGAGTCTGGA GCGCGAAATT 
GCCAGGAACA CCATCATGGA TGTGTCCTAC GTCGGAAGCG ATTCCCATAA GCTGACATCG 
CTGGTCGACA TCAATCCATT CGATTTATCG AATCACTCCG GTGTGCGTCT ACTCAACGAA 
TTGCCGGCGA ACCAGTCCTG CGACGACGCC TTCGGAGGTT TCTGTTTCGC TTCGATGCCG 
GAGTTCAAGA ACGCATCGAA CGCCGTGTAC AACGCACTGG AAGCGAGCGT GACGCGACAA 
CCGACCCCGA CCTGGAAGTT AGGTCAGACC TATTTCACGC TGGCGTACAC GTATGCGCAC 
AACATCGACA ACGCCTCCGG TTTCCGGCAG GTGACCTCCC AAGTGCCGTA CTACAACGGA 
AACCAGTTCC GTGCCAGCGC CGACCAGGAC ATTCACCACC GATTGACGTT CAGTGGCGGT 
TGGGACTTTG CGCTTGACCA ATGGTGGCCT TCCGGATGGA AGCGCCTCAC CCAAGGGTGG 
AGCGTGTTTC CAATCATGAC CTGGAGAACA GGCTTTCCAT ATAGTGTCTT TGCCCGCTTC 
GACGACAGTT TCGACTATAC CGTCCCGGGG CCATCTGGCG CCGGCGATCC CGCACTGGCT 
TATGCCAACG TTGTCGGATC CACGGGGACT CTCGATCCGC GGAAGTATTA TTCCGGCCTT 
GGTGCCGGAG CATACTGGAT CAATCCAAAT TCGTTCAGCA ACGCGAACGA ATATGACTAC 
GGTTCACCAT ATGGCGACTT CGCGCGTAAT AGCCTCCGCG GTCCCCATGA AACGAACCTC 
GACTTCGAAG TCGCGAAGAC CACGAAATTG ACGGAATCGC TACGGATGCA ACTCCGCGCC 
GAAATGTTCA ACGTGTTCAA CCATGCAGAG TTCAGGCTCC CAGATACGAA CATAACCTCA 
CCATCCTTCG GCCAAATTCT CGGTACGTAC GATCCGCGAA TCATCCAGTT TGCGGTTCGC 
TTCACGTTCT AA

Protein sequence

MYRTLRSLCI LVLLSCLSIV SRLVAQDAAG TIFGTITDLQ GSVVPDARVR VTNGATAVSK 
ETVTGKDGSF RVLDLPVGKY TVTAESPGFA VTHSEEKPLQ INQNLRIDIR LQVGTEKTVV 
DVTGEAAGVE TVNSTLGQSV TSRPLVDLPL NGRDVLQLAL LQPGVTETNE GNTGAGSYSI 
GGGRSDSVTF LLDGGINNDL LGNEVVFNPN PDAIAEFRIL QNNYTAEYGR NGGGVISVVT 
KSGGNNFHGS GFEFLRNDAF NANSYFNKLN DLPRNVLKRN QYGGTIGGPI IKNRLFFFVS 
YQGQRLTATE DPSLYGNSTT TTVFTNPELQ NGDFGGDPNV ANFLNAHPYF IAPGHTAADA 
VIDPAKFDPV AQKYIGLGLI PSTSTGELNA IGNQTDNRNE LSAKIDFQLD EQDKIGATFG 
GNRNSETDDF RFSNVPGSPV SNHYSQNFLT LAYTRTFSNS MLNEFRFTAQ RTTHLQDAPL 
GAKHTPADVG VGIHSDDPTG VTVLGFDNGL TIGPSLFGPT NFASNTFSYS DNFSWVRGKH 
SWKFGAGFTP YQNNTLYDFY VNGYFQFNGT GSGNSLADFL LGVPTYYIQY PQAPSNIRSK 
NTFLYAQDEW HVSRRLVLNL GLRYEYSTPK IDTEGRSYSI IPGQQSTVFP NAPNSLVFPG 
DKGTPTGANF PDKNDFGPRL GFAYDVFGDG KTSLRGGVGL FYDILKGEDN LQFNGQPPFF 
SSAGLLFPDA TANSNYAFLA DPYGSAGVTD PFPSKPVDHN LDFGAAGFLP FNNAGSAFFV 
DPHLRTPYTY QYNLSLEREI ARNTIMDVSY VGSDSHKLTS LVDINPFDLS NHSGVRLLNE 
LPANQSCDDA FGGFCFASMP EFKNASNAVY NALEASVTRQ PTPTWKLGQT YFTLAYTYAH 
NIDNASGFRQ VTSQVPYYNG NQFRASADQD IHHRLTFSGG WDFALDQWWP SGWKRLTQGW 
SVFPIMTWRT GFPYSVFARF DDSFDYTVPG PSGAGDPALA YANVVGSTGT LDPRKYYSGL 
GAGAYWINPN SFSNANEYDY GSPYGDFARN SLRGPHETNL DFEVAKTTKL TESLRMQLRA 
EMFNVFNHAE FRLPDTNITS PSFGQILGTY DPRIIQFAVR FTF