Gene Acid345_0559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0559
Symbol
ID	4073048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	687295
End bp	688455
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	58%
IMG OID	637982564
Product	ABC efflux pump, inner membrane subunit
Protein accession	YP_589638
Protein GI	94967590
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4591] ABC-type transport system, involved in lipoprotein release, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00044398
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.112783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGGACT GGGGGCGCGT CCCTTACAAT CGTGAAGACA TGATGAACCG GATGATTGTT 
TCGAACCTGG TCCACCGGCC GCTGCGGTCG GTGATCAGCA TTGTGGCGAT TGCCATCGAA 
GTCACGCTGA TTCTGCTGAT CGTAGGGCTT TCGGTGGGCA TGCTGAACGA CAGCCGCAAG 
CGTACCGCCG GCATTGGTGC GGACGTGATG GTGCAGCCGC CGAATGCGTC GGCCCTGTCC 
ACGTTTAGTA CGGCGTCGGT TCCGATCAAG GTGGCGGGAG CATTGGAGAA GTTGCCGCAC 
GTGATTGCGG CAGTGCCGGT GGTCATGTCG ACCAACACCA GCGGCAGCAT CGAGGTGATT 
TACGGGATCG ATCTGACGGC AGGATCGCCG TATAACTTCG ATAACACGGG CCGGCCGTTC 
CGCTACATTG CCGGCGGACC GTTTCAGGGG CCGAACGACA TGCTGGTGGA CGACTACTTC 
GCCAGCGACA AGCACGTAAA AGTCGGCGAT CAACTGGAGC TGTTTAACCA CAAGTTTCGG 
GTTTCAGGCA TTGTGGAGAA CGGCAAAGGC GCACGCAAGT TCCTGCCGAT TTCGACCTTG 
CAGAATTTGA TGGGGGTGGA AGGCAAGGCC AGCATGTTCT ATCTCCGGCT CGATAATCCG 
GCCAACGCCG ATTTGGTGGT ACAGGAGATC AAGAACACCC CCGGCCTGGA GACCTACACG 
GCACGTTCCC TGCAAGCGTT TCTATCGATG ATGACCGTCG AAAAGCTGCC GGGCTTCTCG 
AACTTCATCA AGGTCGTGGT GGGAATTGCG ATGATCATCG GATTCATTGT GATCTTCCAG 
TCCATGTATA CGGCGGTGAT GGAGCGGACG CGGGAGATCG GGATTTTGAA GTCTCTCGGC 
GCGAACAAGG TTTACATCGT GCGGCTGATC CTGAGGGAGA CGCTGACGCT CGCAGTTTGT 
GGGATCGCGC TGGGTATCGG GTTCAGTTAC GCGGCAAGGC TGGGCATCCG GGCGAAGTTC 
CCGCTGATGA CGGTGCAGAT GACCGCACCG TGGATTGGAT ACGCCACGCT GATCGCGGTC 
GTCGGCGCGA TGATGGGGGC GATTTATCCG GCGGTAAAAG CCGCCCAGAA GGACCCGATT 
GACGCGCTGG CGTATGAGTA G

Protein sequence

MRDWGRVPYN REDMMNRMIV SNLVHRPLRS VISIVAIAIE VTLILLIVGL SVGMLNDSRK 
RTAGIGADVM VQPPNASALS TFSTASVPIK VAGALEKLPH VIAAVPVVMS TNTSGSIEVI 
YGIDLTAGSP YNFDNTGRPF RYIAGGPFQG PNDMLVDDYF ASDKHVKVGD QLELFNHKFR 
VSGIVENGKG ARKFLPISTL QNLMGVEGKA SMFYLRLDNP ANADLVVQEI KNTPGLETYT 
ARSLQAFLSM MTVEKLPGFS NFIKVVVGIA MIIGFIVIFQ SMYTAVMERT REIGILKSLG 
ANKVYIVRLI LRETLTLAVC GIALGIGFSY AARLGIRAKF PLMTVQMTAP WIGYATLIAV 
VGAMMGAIYP AVKAAQKDPI DALAYE