Gene Acid345_4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4072
Symbol
ID	4072494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4821136
End bp	4822530
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	59%
IMG OID	637986103
Product	RND efflux system, outer membrane lipoprotein, NodT
Protein accession	YP_593146
Protein GI	94971098
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID	[TIGR01845] efflux transporter, outer membrane factor (OMF) lipoprotein, NodT family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.153495
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTGCA AACGAATTCT CCTTGCGCTC CTGTTGCTCC TGATGGCCGG CTGCAAAGTC 
GGACCGAACT ACAAACGCCC CGCCGTGACG GTTCCGGATG CTTACCGGGG GCCGACCTTG 
GACGGCGGAC AAGCCAACGG CATCTCCCTG GGCGAGCAGA AGTGGTGGGA TGTCTTCAAC 
GATGAGCAAC TGCAAAAGCT GATCCGACAA GCTCTCGATG CTAACTATGA TGTAAAGATC 
GCCGCGACTC GCGTGCTCCA GGCACAGGCC GCGCTTGGGA TCACACGCGC CGATCAGTTC 
CCCACGATTG CTGGGGGCGC ATCGGCCCTT AACGAGCGTA TCCCGCGGGT GAAAGGCTTG 
CCGGCTTACG AAAACAGCGC GCTCCAGGTA AACCTCTCCC TCGTCTGGCA GCTCGACTTC 
TGGGGTAAAT ATCGTCGCGC CACAGAAGCA GCGCGTGCAG ACTTGCTCTC CACCGAGTGG 
GGCAAGCGCG CCGTCATCAA CAGCGTCATC AGCAACGTCG CCAACGGGTA CTTCCAGTTG 
CTTGAGCTCG ATCGCGAGAT GGAGATCGCC AAGGGCACAT TAGCATCGCG CCAAGAATCG 
TTGCGCTTGG TGAACATCCG TCAAAAGGGC GGAACGACTT CCCTGCTCGA CGTACGTCAG 
TCGGAACAAC TTCTCTACAC GGCCGCCGCT GCCATTCCCG ACCTCGAACG CCGGATCGAG 
CAAGAGGAGA ACTTCATCAG CATCCTCCTC GGCCAGAATC CCGGTCCGAT TCAACGGGGC 
AAGCCGCTCG TCGAATTCGC GATTCTTCCT TCGGTTCCGC CCGGATTGCC CTCGACTTTG 
CTTGAGCGGC GCCCGGACTT GCAGTCGGCG GAGCAGCAAC TGGTCGCAGC GAATGCGCGT 
ATTGGTGTCG CGAAAGCTGA CTACTTTCCA CAGATCTCTC TTACCGCCCT CGGTGGATAC 
CAGAGCTCGG CGCTAACGGG GCTCTTTTCC GGCCCTGCCG GTTTGTGGAG CTTCGGCGGT 
CAACTGGCCC AACCGATCTT CACCGGCGGC AAAATTAGAT CGAACGTGAG ATTAACGGAA 
GCTCAGCAAC AAGAAGCGGT GTTCCGCTAT CAACAGTCCA TTCAGCAAGC GTTCCGTGAA 
GTCTCGGATT CGCTGGTGGC CTATCGCAAG AACCAGGAGT TCCGCGAACA GGAAGCAAAC 
TTGGCGGCTT CTGCCGTGGA TGCTACCCGC CTCGCGCGCA TTCGCTACGA AGGCGGTGTA 
TCCAGCTATC TCGAGGTTCT CGATAACGAC ACTCGCTCGT TCGACGCTGA GATCTCGCTT 
GCCCAGGCAC AACTCGGCGA ACGCGTCGCA TTGGTCCAGC TCTACAACGC ACTCGGCGGC 
GGCTGGCAGC AGTAA

Protein sequence

MNCKRILLAL LLLLMAGCKV GPNYKRPAVT VPDAYRGPTL DGGQANGISL GEQKWWDVFN 
DEQLQKLIRQ ALDANYDVKI AATRVLQAQA ALGITRADQF PTIAGGASAL NERIPRVKGL 
PAYENSALQV NLSLVWQLDF WGKYRRATEA ARADLLSTEW GKRAVINSVI SNVANGYFQL 
LELDREMEIA KGTLASRQES LRLVNIRQKG GTTSLLDVRQ SEQLLYTAAA AIPDLERRIE 
QEENFISILL GQNPGPIQRG KPLVEFAILP SVPPGLPSTL LERRPDLQSA EQQLVAANAR 
IGVAKADYFP QISLTALGGY QSSALTGLFS GPAGLWSFGG QLAQPIFTGG KIRSNVRLTE 
AQQQEAVFRY QQSIQQAFRE VSDSLVAYRK NQEFREQEAN LAASAVDATR LARIRYEGGV 
SSYLEVLDND TRSFDAEISL AQAQLGERVA LVQLYNALGG GWQQ