Gene Acid345_3949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_3949
Symbol
ID	4071332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4671044
End bp	4672267
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	58%
IMG OID	637985975
Product	OmpA/MotB family outer membrane protein
Protein accession	YP_593023
Protein GI	94970975
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.243665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.26275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCGG CGCGGATTTA CCTGCTGCTC GTTGCGGTAG TCCTTGCGAT TCCTTCTGTC 
GCGCAAAACT CCAAACCCCC AGCTGAAGTC GATTTCCTTT CCACGTGGGG AAAAATCCAG 
CAGCGCTATC CGTACGAGAA CTTTGGGCAA TCGACATTTC CTCATTACGG AGAGAACCAG 
ATCAACCGGC GCGGGCGACA CTGGGACCTC TGGGTGCCGA TTCCAGGATC TTATAAAGAC 
CGCTACGAAA CCTGGGCTGC GGTGAAGCCG ACGGTCGTGA AGAGCGGTTG GACCATCATT 
TCGGAGAACC CCCATGGAGG CCTGCTAATC GTGCTGCGCT ACAACCAGAA CGGCGTGGAC 
GCCTGGGCGA ACGCCAGCGT CGACGATGGG GCCTCACCGA TGCGCTTCAC CATGGACCTT 
ATCGAAGTGA CGCCGCCACC GATCTCGATG ACGTTGCATG AGCCGGCGCA AACGCCGGAG 
AAGATGCCGA CAGGAGGGAA GGGCGACTTC CCGTATCTCA CACCGATGCC GGGGTCAGTA 
GCGCACGGCG GCCAAGAAGA AGATACGCCC TTCCGTCTGA CACCCAAGGG AGCGAGCCAG 
GACGAGATTG TGGCCAACGG TTCGGTACTG CGGAACTATT CGCTGAACGA TGGCTCGCAG 
ATCTTATTCG TAGCCGTGTA TCACGACGCG CTTCTCAAAG CGGGCTGGGA CATTGAACAG 
GAAACGCCTA ACGCGGAAGT GATCGTGGCG CACTATGGCA AACATGGGCG CAATTTGTGG 
GCATACCTCA TCGATCATGG CGAGGAGTAC AGCTTTCGGG TTGGTAAAGA GGCCGCACCG 
GATCAGATGA AGTCGAAGCT CATTGCGGAC TGCCACGTGG CGATCTACGG CGTGTTGTTC 
GACTTCAATA AGGCGACACT GCAACCTGAA TCGGATGGGC CGCTGGGACA AGTCGGCGCG 
TTGCTCACGG CGAACTCCTC ACTGAATGTT GAAGTGCAGG GGCATACGGA CAACGTTGGT 
ACAGACGCGT ATAACCAGAC GCTCTCGGAG GCGCGCGCGA AGTCGGTGAT GACGTGGCTG 
ACGCAGCACG GCGTGGCACC AGGGCGGATG ACTGCGAAGG GCTACGGAAA GACAATGCCT 
GTCGCCGATA ACAAGACTGA CGATGGCCGC ATGAAGAATC GCCGGGTGGA GATCGCCGAC 
CCGAAGTGCA AAGCGGGGAA GTGA

Protein sequence

MPSARIYLLL VAVVLAIPSV AQNSKPPAEV DFLSTWGKIQ QRYPYENFGQ STFPHYGENQ 
INRRGRHWDL WVPIPGSYKD RYETWAAVKP TVVKSGWTII SENPHGGLLI VLRYNQNGVD 
AWANASVDDG ASPMRFTMDL IEVTPPPISM TLHEPAQTPE KMPTGGKGDF PYLTPMPGSV 
AHGGQEEDTP FRLTPKGASQ DEIVANGSVL RNYSLNDGSQ ILFVAVYHDA LLKAGWDIEQ 
ETPNAEVIVA HYGKHGRNLW AYLIDHGEEY SFRVGKEAAP DQMKSKLIAD CHVAIYGVLF 
DFNKATLQPE SDGPLGQVGA LLTANSSLNV EVQGHTDNVG TDAYNQTLSE ARAKSVMTWL 
TQHGVAPGRM TAKGYGKTMP VADNKTDDGR MKNRRVEIAD PKCKAGK