Gene VC0395_A1006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1006
Symbol
ID	5137612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1043660
End bp	1044895
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	43%
IMG OID	640532464
Product	methyl-accepting chemotaxis protein
Protein accession	YP_001216952
Protein GI	147673930
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGTT ACCTATTTGA ACGGCTAGAG AATAATAAAA AACGCTATCT TTTCTTCACT 
ATCACTCTAA GCTGCACAGT GCTTCTGTTG GGCTTAGAAC TGGTTCGATA CTGGACTCCG 
CAATGGTTTT ATCTACCGTT TGCGATAACC GCACTTATCT TAACGATGAC CGCTTTGGTT 
TTCTCTCAGG GCAATCTTTT TGTGCGTTTC CTACAACAAA TCCATGAACA AGAAACCATG 
AAACAAAAAG AAACCGTTTC TGCCATTTGC GATTGGATCG ATGAATATCG CGATCTCAAT 
GGCTTAGTCG CGGATCATAT TGAGAACGTA AATTCTGATG CACAAAAAGC CACTGAGGAT 
ATTCTCAATC ACATTTGCTC ATTGGATCAC GCAGCCGCTA ATTTTACTCA CTACCTCAAA 
GACATGGAGT TCGATTCACA AAATATGGTA TCGAGCTTAG ATGAACACAC CTTAGTTATC 
TCAAATCTAG CCGATAGTAC TCGCAGCCTG ATGAGCAATA TCCAAACCGA GCGCAAACAG 
GTTAATGATG TATTAAACCG AGTCATGGGA CTTAACGAGA TCACCGAAGT CATTTCAAAA 
ATTGCTAATG AGACCAATCT ACTCGCCTTG AATGCCGCTA TCGAAGCAGC TCGCAGTGGT 
GAAATGGGAC GTGGCTTTGC TGTTGTCGCA GATGAAGTGC GACATCTTGC TCAGAGAGCT 
GGTGAGGCAG CCTCACAAAT TAGCGAAGAA ATAGAAAGCC TTCGTGCAGA AGTGACTCAA 
CGTTTTGAAG TCGCCAATAA AGAGAGCAGC GAGCAAAACA TCAAAGCTGA TATGATGATT 
GAGTCCGTAC AAAGCTTAAG ACAAAGTTTC TCTTCTGTTC GTGAATTAAG CGAACGACAA 
ATCACCCAAA TCATGTTGTA CAACAATGAT CTTGAGAAAA ATATCAGCGG TAGTATGGCC 
TGTACTCAGT TCCAAGACAT CGTCCGTCAA AAGCTCGATA GCATCGAAGC TTTAATGCGT 
GAAAAACACT TATTGGTGGG TGATGTCTTT AACGGTATGC GCCTCAATGA TCTGCGCCAT 
CGGGAACTAG AATACACAGA AACCCTGCGC CGCCTGTCAT TGGAGTATAG GCACGACTTT 
GAAAGACACT GTAACTATCG CGATTCAGAT ATGAACAGCA CAAAGCAATC GACGTTATCC 
ACTTCAAATC CATTACCGAA AATTGAGCTG TTCTAG

Protein sequence

MIRYLFERLE NNKKRYLFFT ITLSCTVLLL GLELVRYWTP QWFYLPFAIT ALILTMTALV 
FSQGNLFVRF LQQIHEQETM KQKETVSAIC DWIDEYRDLN GLVADHIENV NSDAQKATED 
ILNHICSLDH AAANFTHYLK DMEFDSQNMV SSLDEHTLVI SNLADSTRSL MSNIQTERKQ 
VNDVLNRVMG LNEITEVISK IANETNLLAL NAAIEAARSG EMGRGFAVVA DEVRHLAQRA 
GEAASQISEE IESLRAEVTQ RFEVANKESS EQNIKADMMI ESVQSLRQSF SSVRELSERQ 
ITQIMLYNND LEKNISGSMA CTQFQDIVRQ KLDSIEALMR EKHLLVGDVF NGMRLNDLRH 
RELEYTETLR RLSLEYRHDF ERHCNYRDSD MNSTKQSTLS TSNPLPKIEL F